论文部分内容阅读
【摘 要】数据挖掘(DM)是由决策环境变化所驱动的。当前,许多连续制造业需要对长期管理中的大量数据做更深层次的分析与处理,需要找到一个连接数据与调度决策知识规则之间的桥梁。把DM技术集成到氧气生产调度决策支持系统中,从而可以提供更多的调度决策支持信息。
【关键词】数据挖掘; 调度决策; 氧气生产
中图分类号:TU591 文献标识码:A 文章编号:1009-8283(2010)06-0305-01
1 什么是数据挖掘技术
数据挖掘就是从大量的、不完全的、有噪声的、模糊的、随机的数据中提取人们感兴趣的知识和规则的过程。通过数据挖掘,有价值的知识、规则或高层次的信息就能从数据库的相关数据集合中抽取出来,为决策提供依据,从而使数据库作为一个丰富可靠的资源为知识归纳服务
数据挖掘通过预测未来趋势及行为,做出前摄的、基于知识的决策。数据挖掘的目标是从数据库中发现隐含的、有意义的知识,主要有以下五类功能,即:
自动预测趋势和行为、关联分析、聚类、概念描述、偏差检测等。
常用的数据挖掘技术的运用可以分成三大类。1)统计分析类。利用数据挖掘技术可以检查那些异常形式的数据,然后,利用各种统计模型和数学模型解释这些数据,解释隐藏在这些数据背后的市场规律和商业机会;2)知识发现类。
它可以从数据仓库的大量数据中筛选信息,寻找市场可能出现的运营模式,发掘人们所不知道的事实;3)其他数据挖掘技术。其他挖掘技术中包括文本数据挖掘、WEB数据挖掘、分类系统、可视化系统、空间数据挖掘和分布式数据挖掘等。
2 用数据挖掘解决调度决策问题
生产调度问题是指产品在制造过程中,在满足各种生产约束(如作业优先级、设备能力、交付日期等)的前提下,实现人力、材料、机器等共享资源的有效配置及使用顺序,以达到生产费用最低的目的。
生产调度管理可以描述为:在一定的时间范围内为完成特定的生产任务而分配共享资源,并使得预定的某些生产指标最优。调度问题的解决是一个资源限制的寻优过程,可以用机器排序、数学规划的方法来建立调度算法和调度模型。但求解调度问题,存在计算复杂性,通过引入有效的调度规则,减小寻优问题的求解空间,可以大大缩短寻优过程。80年代后期以来,计算机科学与技术的进步使得工业控制与管理手段日趋复杂,许多新方法逐步应用到生产调度研究中,如专家系统、神经网络、反馈控制、DEDS监控方法等。
目前,求解生产调度的方法大致可分为两类:一类是基于模型的生产调度。这种方法的求解步骤是:首先在定义调度问题的基础上建立调度模型(常用的有数学规划模型、控制系统模型等),然后基于该模型运用一定的调度算法进行求解。这类方法的特点是根据一定的性能指标进行寻优,对规模小、相对简单的问题能得到令人满意的最优解;但随着问题规模的增大,求最优解将变得不可行;另一类是基于规则的生产调度。这种方法完全根据一定的规则或策略来确定生产系统中的下一步操作。通过应用各种调度规则,能够为局限于规则搜盖范围内的问题产生合理的解决方案。这种方法的特点是不必进行大盘的计算,有了合适的规则以后可以很快地生成调度方案。
数据挖掘也可以称之为在数据库中的知识发现(KDD:Knowledge Discovery in Database),可以帮我们从大型数据库或数据仓库中提取人们感兴趣的知识,这些知识是隐含的、事先未知的潜在有用信息,提取的知识一般可表示为概念(Concepts)、规则(Rules)、规律(Regularities)、模式(Patterns)等形式。目的是帮助决策者寻找数据潜在的关联,并发现被忽略的因素。
3 数据挖掘技术在氧气生产中的应用
氧气公司生产运作管理的主要任务是要生产工艺各个环节能协调地进行,保证生产计划的全面完成;生产运作管理最终目标是在保证质量的前提下稳定生产。合理的计划安排、科学的生产进度控制和优化的生产工艺对于氧气公司产量、质量和降低成本的方面至关重要。调度DSS和数据挖掘集成思想可以帮我们解決很多问题,例如,我们对于生产进度控制多采用统计挖掘技术的预测、关联分析和趋势分析等功能;对于合理安排计划指标,合理安排主要生产工艺参数指标可以采用RS和聚类方法帮我们选择最优的规则;对于选择最佳的生产工艺甚至是局部的生产工艺最佳曲线可以采用决策树分类方法解决。
(1)应用于生产工艺指标数据挖掘。由于工业气体生产的生产工艺参数大多取连续值,因此有效进行连续属性的离散化处理是RS理论中常用的连续属性离散化方法主要分为两类:一类是仅对每一个属性的属性值进行划分的局部离散方法;另一类是考虑全部条件属性的属性值进行划分的全局离散方法。
氧气公司生产过程自动化系统较高,我们可以利用基于对不断积累的历史生产数据进行挖掘来得到生产工艺控制规则,以辅助调度员和现场操作人员不断总结经验,尽快找到比较理想的生产工艺控制参数,在此基础上再结合各种智能控制方法来达到更优的控制。
(2)应用于最佳工艺数据挖掘.工业气体生产是很特殊的一个领域,计算机在其中多数起着数据采集、状态监测和实时控制的作用,这一过程中同样会产生大量的实时采集数据,人工一般是很难理解这些数据及其关系的,更不用说发现其中的规律了。如果能让计算机自动实时地从产生的数据中抽取知识或规则,寻找最佳的工艺过程,或根据已获得的知识对发生偏离的过程进行实时纠正,那么将会收到更加良好的效果。近年来,我们一直从事实时过程中的数据采集及控制软件的开发,深感这一研究的重要性,因此根据工艺过程控制中的特殊性,采用基于分类的最佳工艺过程探索的数据挖掘算法。
(3)统计类数据挖掘用于调度决策.统计类数据挖掘工具可以在时序数据和序列数据中发挥重要作用,主要是趋势分析、相似性探索、与时间有关数据的序列模式挖掘和周期性模式的挖掘[50]。在连续生产过程中,积累了大量的实时数据和历史数据,我们可以利用一些统计思想挖掘这些数据,帮助决策者合理安排生产计划,及时完成调度任务。
生产预计分析:计划期结束之前,根据进度统计数据所反映的计划完成进度和生产进度趋势,对本期计划指标的可能性进行预测,再根据结果采用不同的措施。
参考文献:
[1] 印勇:决策支持分析新技术—数据挖掘,重庆邮电学院学报,2001增刊。
[2] 任艳频,张佐,吴秋峰:一类规则调度系统的Petri网研究方法,计算机集成制造系统,1999。
【关键词】数据挖掘; 调度决策; 氧气生产
中图分类号:TU591 文献标识码:A 文章编号:1009-8283(2010)06-0305-01
1 什么是数据挖掘技术
数据挖掘就是从大量的、不完全的、有噪声的、模糊的、随机的数据中提取人们感兴趣的知识和规则的过程。通过数据挖掘,有价值的知识、规则或高层次的信息就能从数据库的相关数据集合中抽取出来,为决策提供依据,从而使数据库作为一个丰富可靠的资源为知识归纳服务
数据挖掘通过预测未来趋势及行为,做出前摄的、基于知识的决策。数据挖掘的目标是从数据库中发现隐含的、有意义的知识,主要有以下五类功能,即:
自动预测趋势和行为、关联分析、聚类、概念描述、偏差检测等。
常用的数据挖掘技术的运用可以分成三大类。1)统计分析类。利用数据挖掘技术可以检查那些异常形式的数据,然后,利用各种统计模型和数学模型解释这些数据,解释隐藏在这些数据背后的市场规律和商业机会;2)知识发现类。
它可以从数据仓库的大量数据中筛选信息,寻找市场可能出现的运营模式,发掘人们所不知道的事实;3)其他数据挖掘技术。其他挖掘技术中包括文本数据挖掘、WEB数据挖掘、分类系统、可视化系统、空间数据挖掘和分布式数据挖掘等。
2 用数据挖掘解决调度决策问题
生产调度问题是指产品在制造过程中,在满足各种生产约束(如作业优先级、设备能力、交付日期等)的前提下,实现人力、材料、机器等共享资源的有效配置及使用顺序,以达到生产费用最低的目的。
生产调度管理可以描述为:在一定的时间范围内为完成特定的生产任务而分配共享资源,并使得预定的某些生产指标最优。调度问题的解决是一个资源限制的寻优过程,可以用机器排序、数学规划的方法来建立调度算法和调度模型。但求解调度问题,存在计算复杂性,通过引入有效的调度规则,减小寻优问题的求解空间,可以大大缩短寻优过程。80年代后期以来,计算机科学与技术的进步使得工业控制与管理手段日趋复杂,许多新方法逐步应用到生产调度研究中,如专家系统、神经网络、反馈控制、DEDS监控方法等。
目前,求解生产调度的方法大致可分为两类:一类是基于模型的生产调度。这种方法的求解步骤是:首先在定义调度问题的基础上建立调度模型(常用的有数学规划模型、控制系统模型等),然后基于该模型运用一定的调度算法进行求解。这类方法的特点是根据一定的性能指标进行寻优,对规模小、相对简单的问题能得到令人满意的最优解;但随着问题规模的增大,求最优解将变得不可行;另一类是基于规则的生产调度。这种方法完全根据一定的规则或策略来确定生产系统中的下一步操作。通过应用各种调度规则,能够为局限于规则搜盖范围内的问题产生合理的解决方案。这种方法的特点是不必进行大盘的计算,有了合适的规则以后可以很快地生成调度方案。
数据挖掘也可以称之为在数据库中的知识发现(KDD:Knowledge Discovery in Database),可以帮我们从大型数据库或数据仓库中提取人们感兴趣的知识,这些知识是隐含的、事先未知的潜在有用信息,提取的知识一般可表示为概念(Concepts)、规则(Rules)、规律(Regularities)、模式(Patterns)等形式。目的是帮助决策者寻找数据潜在的关联,并发现被忽略的因素。
3 数据挖掘技术在氧气生产中的应用
氧气公司生产运作管理的主要任务是要生产工艺各个环节能协调地进行,保证生产计划的全面完成;生产运作管理最终目标是在保证质量的前提下稳定生产。合理的计划安排、科学的生产进度控制和优化的生产工艺对于氧气公司产量、质量和降低成本的方面至关重要。调度DSS和数据挖掘集成思想可以帮我们解決很多问题,例如,我们对于生产进度控制多采用统计挖掘技术的预测、关联分析和趋势分析等功能;对于合理安排计划指标,合理安排主要生产工艺参数指标可以采用RS和聚类方法帮我们选择最优的规则;对于选择最佳的生产工艺甚至是局部的生产工艺最佳曲线可以采用决策树分类方法解决。
(1)应用于生产工艺指标数据挖掘。由于工业气体生产的生产工艺参数大多取连续值,因此有效进行连续属性的离散化处理是RS理论中常用的连续属性离散化方法主要分为两类:一类是仅对每一个属性的属性值进行划分的局部离散方法;另一类是考虑全部条件属性的属性值进行划分的全局离散方法。
氧气公司生产过程自动化系统较高,我们可以利用基于对不断积累的历史生产数据进行挖掘来得到生产工艺控制规则,以辅助调度员和现场操作人员不断总结经验,尽快找到比较理想的生产工艺控制参数,在此基础上再结合各种智能控制方法来达到更优的控制。
(2)应用于最佳工艺数据挖掘.工业气体生产是很特殊的一个领域,计算机在其中多数起着数据采集、状态监测和实时控制的作用,这一过程中同样会产生大量的实时采集数据,人工一般是很难理解这些数据及其关系的,更不用说发现其中的规律了。如果能让计算机自动实时地从产生的数据中抽取知识或规则,寻找最佳的工艺过程,或根据已获得的知识对发生偏离的过程进行实时纠正,那么将会收到更加良好的效果。近年来,我们一直从事实时过程中的数据采集及控制软件的开发,深感这一研究的重要性,因此根据工艺过程控制中的特殊性,采用基于分类的最佳工艺过程探索的数据挖掘算法。
(3)统计类数据挖掘用于调度决策.统计类数据挖掘工具可以在时序数据和序列数据中发挥重要作用,主要是趋势分析、相似性探索、与时间有关数据的序列模式挖掘和周期性模式的挖掘[50]。在连续生产过程中,积累了大量的实时数据和历史数据,我们可以利用一些统计思想挖掘这些数据,帮助决策者合理安排生产计划,及时完成调度任务。
生产预计分析:计划期结束之前,根据进度统计数据所反映的计划完成进度和生产进度趋势,对本期计划指标的可能性进行预测,再根据结果采用不同的措施。
参考文献:
[1] 印勇:决策支持分析新技术—数据挖掘,重庆邮电学院学报,2001增刊。
[2] 任艳频,张佐,吴秋峰:一类规则调度系统的Petri网研究方法,计算机集成制造系统,1999。