论文部分内容阅读
随着科学技术和智能控制技术的迅速发展,在工业企业管理系统中积累了大量的历史数据,而从这些历史数据中挖掘潜在的领域知识和关联关系,可以为工业管理中的决策控制和领域经验丰富提供帮助,是数据挖掘领域的重要分支之一。由于工业企业上报数据存在数据量大,多维性,含有大量数值型数据等特点,难以建立精准的数学模型。而通过传统的关联规则挖掘方法会造成数值型数据的分区过硬,造成潜在信息丢失等问题。本文将模糊关联规则挖掘算法应用于工业企业能源管理上报数据中,挖掘实时数据中潜藏的关联关系,为工业企业能源管理决策和控制提供可参考的依据。本文在对比当前常用方法的基础上,首先介绍了关联规则以及模糊关联规则的基本提取方法,并针对当前模糊关联规则提取算法中的不足,提出一种基于自适应聚类的改进模糊关联规则挖掘算法,最后将本文的算法应用于工业企业能源管理领域的数据关联关系挖掘中。针对数据挖掘中数值属性分区过硬导致的信息丢失问题,在本文中,提出一种改进的模糊聚类关联规则挖掘方法,该算法首先采用改进的C均值聚类算法处理原始的数据集,剔除冗余数据,并产生模糊分区,克服传统C均值聚类算法对初始聚类中心敏感,容易在迭代过程中陷入局部最小值的缺点,再利用模糊分区将原始的数据集映射到模糊区间内,之后采用实验结果表明,该方法能加快目标函数收敛速度,提升挖掘效率,提高关联规则的语义直观性和可信度。利用模糊关联规则挖掘算法,将其应用在工业企业能耗管理系统数据集中,设计了基于能源利用的关联规则提取模型,提取出相关规则,并通过对挖掘出的规则解释分析,提出了部分优化建议,为工业管理和控制领域科学决策提供依据。