论文部分内容阅读
随着信息技术和制造技术的飞速发展以及市场的激烈竞争,制造业的发展方向由传统的大规模生产模式转变为以客户为中心的大规模定制模式。制造业保持竞争力的方式越来越依赖信息化技术,产品生命周期各个阶段产生了大量的产品信息,如:产品需求信息、产品设计信息、制造数据信息、供应链数据、运营数据信息、外部行业信息等。产品信息大数据环境是未来制造业构建智能工厂的底层数据支持,是实施大规模定制的基础。当大规模定制产品信息达到一定的数据规模,可以利用数据挖掘技术以全新视角感知产品信息,获取有价值的知识和经验。本文通过分析大规模定制环境下的数据挖掘需求,对客户需求的获取、存储、分类技术和产品配置资源库的建立过程进行了深入研究,将大数据挖掘技术应用于客户需求处理和产品配置设计。本文具体研究内容如下:(1)阐述大规模定制发展的趋势和出现的问题,研究将Hadoop和数据挖掘技术应用于大规模定制的可行性。分析大规模定制在客户需求处理与产品配置阶段出现的相关问题,设计基于Hadoop的数据挖掘系统架构,阐述其设计思想和各个模块设计方案。(2)客户需求信息数据挖掘技术。建立规范化客户需求的拓扑表达模型,设计客户需求的采集与存储方案。设计开发基于MapReduce的贝叶斯分类算法,利用历史需求信息训练分类器,然后利用分类器对客户需求进行规范化处理,然后将其按照需求文档处理级别进行分类和标记,为产品配置任务做准备。(3)产品配置信息数据挖掘技术。设计产品配置单元模型和产品配置模板模型,将产品配置信息存储在产品配置模板中,最终建立产品配置实例库。设计基于MapReduce的C4.5决策树算法,从大量的产品配置实例中挖掘潜在的产品配置规则,建立产品配置规则库。(4)针对大规模定制业务需求,开发面向大规模定制的数据挖掘系统,阐述基于Hadoop的大数据挖掘系统的工作流程以及数据挖掘算法的运行情况。对大规模定制中的产品配置信息进行数据挖掘,在理论和实际应用上进行了有益尝试,通过搭建大数据挖掘系统为实现产品智能配置打下了基础。