论文部分内容阅读
随着数据库技术的快速发展,各个领域堆积的数据也越来越多。数据库虽然有着很强大的采集数据和存储数据的能力,但是数据分析能力却相对薄弱。无法挖掘到隐藏在海量数据背后的信息,导致数据爆炸但知识匮乏的普遍现象。如何从海量的数据中提取有用的知识成为当务之急,数据挖掘也正成为当今信息技术的一个重要研究内容。
中国棉纺业是传统产业支柱之一,随着信息技术的迅速发展,棉纺业需要用完善的信息技术方式来提升企业的核心竞争力。国家已经把棉纺织业确定为信息化建设的试点行业,这将会促进纺织业的迅速发展,推动信息化建设,但是目前纺织业在企业信息化建设方面还不够成熟,特别在对原棉质量等级划分这个方面是一个值得研究的问题。
本文在基于所设计的原料质量管理信息系统的基础上,收集了原棉主要属性的数据集,实现了预测原棉质量等级划分的目的,本文的主要工作与成果是如下:
(1)首先分析了目前棉纺质检的情况并提出相应的问题,然后介绍了数据挖掘技术中的常用算法。(2)并对SAS统计分析软件中的功能模块进行了阐述,根据本文的原棉数据情况,选择了SAS模块中Enterprise Miner模块作为本文的挖掘工具。(3)设计了原棉质量管理信息系统,然后对原棉主要属性的数据集进行收集,选用最具有知名度的SAS统计分析软件对目标数据集进行清洗和集成。(4)利用数据挖掘技术的相关算法(回归算法、聚类算法、决策树算法)和SAS/EM工具对目标数据集进行分析,建立了决策树模型、回归模型和聚类模型,并对各个模型结果进行了分析和对比,结果模型图显示了原棉质量等级划分的规律,实验结果表明决策树模型的实施效果最佳。
在棉纺织厂的管理中,质量管理起着举足轻重的作用。掌握了原产品的质量情况,就可以实时调整方案,从而可以提高成品的质量而且降低经营成本。数据挖掘技术在棉纺质检中的应用有助于提高生产效率,实现质量管理的系统化和规范化,为企业做出科学合理的经营决策,从而提高企业的市场竞争力。