基于工业大数据的柔性作业车间动态调度

您所在的位置：网站首页 › 作业调度过程 › 基于工业大数据的柔性作业车间动态调度

基于工业大数据的柔性作业车间动态调度

2023-03-23 04:46| 来源: 网络整理| 查看: 265

摘要：为提高柔性作业车间动态调度的实际可操作性、计算效率与对车间扰动的实时响应能力，提出一种从具有工业大数据特点的调度相关历史数据中挖掘调度规则的方法。该方法在进行数据预处理时，结合开源大数据技术完成数据采集、清洗、整合与筛选。同时，考虑到动态调度问题中，扰动环境变化会改变生产属性对于调度决策的影响程度，对调度相关历史数据集合进行基于扰动属性的聚类，从而对不同扰动环境下做出的调度决策所产生的数据集合进行合理划分。此外，在调度规则挖掘中，提出了改进的随机森林算法。通过实例研究证明了该调度规则挖掘方法的可行性与有效性。

关键词：柔性作业车间；动态调度；调度规则挖掘；聚类；改进随机森林算法；工业大数据

中图分类号：TP18 ；TP391 文献标识码：A

引言

柔性作业车间动态调度问题已经得到广泛的研究[1‐7]。但随着产品需求不断向个性化转变，制造工艺更加多样，实际调度问题也变得更加复杂，制造企业对车间调度问题的解决方法在实际可操作性、计算效率以及对车间扰动的实时响应能力等方面都提出了更高的要求。优先调度规则是一种简单的启发式规则，其计算效率高、实际可操作性强且可用于实时调度，适用于复杂动态的调度环境[8]。但优先调度规则的性能受到实际环境变化的影响，单一的调度规则不能在所有扰动环境中都有较好的调度性能。为满足实际作业车间调度的需求，一种可行的思路是从调度相关历史数据中挖掘关于调度规则的调度知识来指导实际车间调度活动[9]。通过数据挖掘来解决调度问题的研究主要分为结合已有优先调度规则的方法与从调度相关历史数据中挖掘调度规则的方法。

在结合已有的优先调度规则方面，Wang 等[10]针对半导体行业，提出一种结合决策树与神经网络从调度相关历史数据中挖掘优先调度规则选择机制的方法，该选择机制可以得到当前环境下最适合的优先调度规则。Zhang等[11]通过聚类将车间状态进行划分，并借助强化学习从仿真数据中学习如何在不同车间状态下选择最合适的优先调度规则。Ma 等[12]提出了基于支持向量回归（Support Vector Regression，SVR）的动态调度问题解决方法，该方法借助SVR挖掘得到针对不同车间实时状态的优先调度规则组合方法。Nasiri等[13]通过多层感知人工神经网络、径向基函数和数据包络分析，从离散事件仿真数据中挖掘得到针对机器的优先调度规则实时组合方法。

优先调度规则仅通过少量信息作出调度决策，这可能导致调度结果不尽如人意，因此从调度相关历史数据中提取新的调度规则是另一种思路。LI等[14]提出一种利用决策树从调度相关历史数据中得到全新调度规则的方法，并通过实验证明了所提取的调度规则能很好地拟合原调度方案。Sigurdur等[15]提出一种两阶段的调度知识学习方法，首先学习如何从调度过程数据中得到适合挖掘的训练实例，再对这些训练实例进行调度规则的挖掘。王成龙等[16]提出一种结合 Petri 网建模的分支定界算法与决策树算法的调度规则挖掘方法，提取的调度规则可用于指导静态作业车间调度。Tarik 等[17]针对单机总加权拖期最小化调度问题展开研究，提出一种采用神经网络的调度规则挖掘方法。Ingimundardottir 等[18]为了提高调度规则的挖掘效率与准确率，提出一种训练数据的构造方法，并通过偏好学习的方法，从训练数据中挖掘调度规则。Zahmani 等[19]提出一种结合数据挖掘算法与遗传算法的单机总加权拖期最小化调度问题求解方法，采用数据挖掘算法挖掘调度规则，并运用遗传算法使用这些调度规则。

综上所述，目前关于从调度相关历史数据中挖掘调度规则的方法主要针对普通作业车间调度问题，但将其运用于柔性作业车间动态调度问题的较少。此外，上述方法所使用的调度相关历史数据偏向于理论数据，随着智能感知设备在车间层的大量使用，车间开始向智能化发展[20]，车间调度相关历史数据呈现出规模大、价值低、连续采样、高维等工业大数据的特点。

为此，本文提出一种针对柔性作业车间动态调度问题的调度规则挖掘方法。该方法在处理具有工业大数据特点的调度相关历史数据时，使用了Ha‐doop 生态体系下的开源大数据技术，完成数据采集、清洗、整合与筛选。同时，考虑到在动态调度中，车间扰动环境的变化会改变生产属性对于调度决策影响的大小，因此，该方法以调度方案为单元采用DBSCAN（density‐based spatial clustering of appli‐cations with noise ）聚类方法对预处理的数据进行聚类，将不同扰动环境下作出的调度决策所产生的数据进行划分。在以往关于调度规则挖掘的研究中，决策树是一种被广泛采用的挖掘方法，但决策树的泛化能力弱，不适合大规模、高维度且存在噪声的调度相关历史数据集的调度规则挖掘，因此本文提出了改进的随机森林算法。最后，通过实验验证了该调度规则挖掘方法得到的调度规则在具有优先调度规则优点的同时，还具有较好的调度性能。

1 调度任务定义

柔性作业车间的车间模式可以描述为：在作业车间的生产中，有 n 个待加工工件和 m 个可选加工机器，每个工件都有多道加工工序，每道工序可以在多台机器上加工完成。同时，在车间的运行过程中，还会发生例如机器故障、原材料短缺、收到紧急订单等扰动。

调度规则是一种实时调度的方法，挖掘所得调度规则的调度任务是在考虑扰动的情况下解决两个子问题：①工件的机器选择问题；②空闲机器从队列中选择工件进行加工的问题。通过两两比较选出最优的方法，可以将上述两个子问题转换成以下两个分类问题：①对于某一工件的某道工序，给定可以加工这道工序的机器集合中的任意两台机器，比较这两台机器，区分出适合该工件加工的机器与不适合该工件加工的机器；②对于某台空闲机器，给定在这台机器排队等待加工的工件集合中的任意两个工件，比较这两个工件，区分出加工优先性高的工件与加工优先性低的工件。

2 调度规则挖掘架构

柔性作业车间是一类工序加工路径可以灵活调整的车间模式，在该模式的运行中会遇到各种扰动事件，同时会产生具有规模化、高维度、多样化特点的调度相关历史数据。针对柔性作业车间的特点，本文设计了如图 1 所示的调度规则挖掘架构。该架构由结合大数据的数据预处理模型、基于扰动属性的聚类策略与基于改进随机森林算法的挖掘模型3部分组成。

结合大数据的数据预处理模型的主要任务是处理来自于制造执行系统（Manufacturing Execution System，MES）、企业资源计划（Enterprise Resource Planning ，ERP）、数据采集与监控系统（Supervisory Control and Data Ac-quisition，SCADA）等现有的信息系统中与调度相关的历史数据。该模型结合大数据技术，通过数据采集、数据清洗、数据整合与数据筛选，将具有工业大数据特点的调度相关历史数据转化成可以进行调度规则挖掘的数据形式。

柔性作业车间中扰动环境的变化会改变生产属性对调度决策的影响程度，通过基于扰动属性的聚类策略，可以对不同扰动环境下作出的调度决策产生的调度相关历史数据进行合理的划分。在此基础上，通过数据挖掘算法可以从聚类后的每个簇中分别得到针对不同扰动环境的调度规则。在扰动环境发生改变时，切换不同的调度规则，以此提高调度规则对扰动的实时响应能力。

通过基于改进随机森林算法挖掘模型，可以从调度相关历史数据中发现有价值的调度规律或模式，并以调度规则的形式表现。在该模型中提出一种改进的随机森林算法，并以此作为调度规则的挖掘算法，得到的随机森林调度规则由多棵决策树构成，通过贝叶斯投票机制得到每棵决策树加权后的结果，从而区分出合适的机器或加工优先性更高的工件。

2.1 结合大数据技术的调度历史数据预处理模型

随着信息技术、自动化技术、物联网技术在制造业的飞速发展，特别是无线传感器、数据采集装置和其他智能感知设备在车间底层的大量使用，企业全面和精准获取具有大数据特点的调度相关历史数据的能力大幅增强[21]。对于这些多源异构的调度大数据，需要通过恰当的数据预处理，才能从中获取想要的调度知识。本文提出一种结合大数据技术的调度数据预处理模型，包括数据采集、数据清洗、数据整合与数据筛选 4 个部分，如图 2 所示。

2.1.1 数据采集

调度数据采集是调度规则挖掘的前提，其目标是从多个数据源中采集柔性作业车间制造的调度相关历史数据。本文使用 Hadoop 生态体系下的数据采集工具 Sqoop 与 Flume，从数据库或文件系统中获取调度方案执行时机器、工件和人员等信息。考虑到柔性作业车间动态调度问题是在有扰动的环境下解决工件的机器选择问题和空闲机器的工件选择问题，因此采集的调度相关历史数据集合 Dh（简称调度数据集合）可以表示为 Dh＝｛ d1，d2，d3｝。其中：d1 为调度方案制定时与扰动相关的系统扰动信息，如车间中机器故障数量、返工工件数量等；d2 为工件的某道工序选择加工机器时，当前可以加工这道工序的机器集合中每台机器的状态信息，如机器前在制品数量、机器加工这道工序的时间等；d3为空闲机器需要在等待队列中选择工件进行加工时，当前队列中每个工件的状态信息，如工件在该机器上加工的时间、工件是否为返工工件等。

2.1.2 数据清洗

在车间智能化的发展趋势下，势必会造成对调度相关历史数据进行多次重复的记录，导致从多个业务系统中采集的调度数据集合 Dh 中存在数据冲突与数据重复等情况，只有对复杂多样的调度数据进行数据清洗才能为后续的调度规则挖掘奠定基础。本文通过建立过滤规则库和数据清洗规则，定义每种生产属性需要使用的过滤规则以及过滤规则内部的数据处理逻辑，对采集得到的多源调度历史相关数据进行清洗工作。基于该过滤器与数据清洗规则，每一条采集的数据会根据自身属于调度数据集合 Dh 中哪一部分的哪一类数据，查询数据清洗规则中的数据清洗方法，从规则库中选择相应的过滤规则进行组合，并通过 Spark（为大规模数据处理而设计的快速通用的计算架构）完成最终的数据清洗工作。经过数据清洗的调度数据集合 Dh 将被存入到 Hadoop 分布式文件系统（Hadoop Distributed File System，HDFS）中。

2.1.3 数据整合

调度数据集合 Dh 中的数据形式混乱，无法直接用于接下来的数据筛选、聚类以及调度规则挖掘工作，需要通过数据整合整理调度数据集合 Dh 的数据形式。数据整合的目的是将调度数据集合 Dh中的数据以调度方案为单元进行划分，并将其转化为适合数据挖掘的表达形式。数据整合工作分为两个阶段：第一阶段的整合通过数据仓库工具 Hive使用 SQL 语句对 HDFS 文件系统中的调度数据集合 Dh以调度方案为单元进行划分，即将一次调度方案在执行中产生的调度相关历史数据划分到一起；第二阶段的整合使用 Spark 将第一阶段整合的数据中的 d2 与 d3 部分转化为训练实例，用于调度规则挖掘，转化为训练实例的过程如下，以采集的调度数据集合 Dh 的 d2 部分为例，将某历史调度方案中实际选择的机器 m1 视为最合适的机器，将其与其他可加工该工序的备选机器集合｛m2 ，m3 ，⋯ ｝中的机器一一比较形成训练实例，具体表达形式如表1 所示。最终完成数据整合的调度相关历史数据集合，以调度方案单元的形式存储到 NoSql 数据库Hbase 中。

未完。

来源：万方数据，作者：汤洪涛、费永辉、陈青丰、詹燕、鲁建厦、李晋青，若有侵权联系删除

获取全文，关注订阅号“智能制造趋势”，点免费下载，回复315即可。

【本文地址】

基于工业大数据的柔性作业车间动态调度

基于工业大数据的柔性作业车间动态调度

今日新闻

推荐新闻