论文部分内容阅读
当前,数据挖掘已成为数据库系统研究领域日益受重视的研究主题之一。数据挖掘技术可以通过对大量的数据进行探索分析,挖掘出有意义的规则,以期对未来的决策提供适当的参考建议。PLM(Product Life-Cycle Management,产品生命周期管理)是近年来兴起的一种极具潜力的商业IT战略,它是企业信息化(尤其是制造业信息化)非常重要的组成部分。在PLM系统中应用数据挖掘技术能够很好地提升PLM的核心竞争力,有利于企业的信息化建设。 本论文从数据挖掘的基本原理和技术入手,对数据库知识发现进行了深入研究,探讨了几种知识发现的方法,分析了数据挖掘所采用的技术、方法和应用领域,重点研究了在PLM中应用数据挖掘技术需要解决的关键问题及解决方法。 本论文按照数据挖掘标准流程CRISP—DM(CRoss-Industry Standard Process—Data Mining)设计了PLM系统中应用数据挖掘技术的解决方案。该方案采用基于最大—最小规范化的属性构造方法和基于径向基函数神经网络的数据聚类方法进行数据预处理,结合PLM系统数据分析业务,采用基于高频模式树的项约束关联规则发现方法分析产生次品的潜在因素;采用聚类分析算法CLIMB(clustering algorithm based on subspace)分析产品的物流数据与产品利润之间的关系;采用基于信息熵的决策树算法来分析和预测客户给企业创造价值的潜能,并根据业务数据阐述了这些算法应用于PLM系统数据分析业务的具体思路。 本文从现代软件工程技术的角度,用面向对象的分析设计方法,对PLM数据挖掘系统的体系结构及各功能模块进行了论述,并设计实现了PLM数据挖掘系统。