面向产品持续质量控制的数据挖掘技术与应用研究

来源 :中南大学 | 被引量 : 0次 | 上传用户:angle4781
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
知识是制造企业最有价值的资产。数据挖掘能够从大量的各种业务数据中提炼出有价值的知识,从而极大促进了制造技术和制造模式的发展。关联规则挖掘是一种最重要的数据挖掘技术之一,它可以有效地发现数据项之间的关联,并且规则的表达形式简洁,易于理解和解释,因此关联规则挖掘算法的研究具有重要的理论意义和广阔的应用前景,一直是数据挖掘领域研究的热点。本文对关联规则挖掘关键技术及其在产品持续质量改善中的应用做了深入的研究,主要的创新性工作包括:(1)为了构建条件FP-tree,FP-growth算法必须扫描数据库两次,这极大制约了它的应用。针对这一局限性,本文提出一种新颖的FP阵列技术,直接从FP阵列得到频繁项的计数,从而极大减少了遍历FP-tree的需要。本文将FP-tree数据结构与FP阵列有效地结合起来,分别提出了挖掘频繁项集和闭频繁项集的新算法。实验评测表明这两种算法在运行时间、内存消耗和可扩展性方面都具有稳定优良的性能,尤其对于稀疏数据库。(2)Apriori算法和FP-growth算法都是以批处理方式处理所有事务,无法满足动态更新关联规则的需要。本文在FUFP算法的基础上提出了一种基于次频繁项的改进算法,在算法中引入两个支持度阈值:阈值上限和阈值下限。如果处理的新事务数没有达到一定的值(由两个支持度阈值和数据库的规模决定),该算法就不需要重新扫描原数据库,从而提高了关联规则更新的效率。实验评测表明数据库的规模越大,算法的性能优势越明显。(3)传统关联规则挖掘算法不能同时处理多种类型的数据,无法适应多样性客户需求数据挖掘的需要。针对这一局限性,本文首先给出了各种数据类型的定义以及挖掘的规则模式的定义,提出用相似度统计项目的支持度计数,然后提出一种基于模糊集的新方法以统一的方式处理各种数据类型,最后提出一种基于Apriori的模糊关联规则挖掘算法,并将其应用到电动自行车问卷调查数据的关联分析。(4)以上述研究工作为基础,本文开发了一个产品持续质量改善信息系统(ARMS),其目标是以低成本、低资源消耗为代价生产高质量产品,提高客户的满意度。ARMS由三个模块组成:流程数据集成模块、关联规则挖掘模块和关联规则优化模块。ARMS系统采用基于XML的流程质量语言将各有关部门的流程数据集成到中央数据仓库,在此基础上采用本文提出的新算法发现不同部门的流程参数组合与产品质量特性之间的关联规则,再运用遗传算法优化这些规则,从而帮助流程工程师调整流程参数的设置以持续提高产品的质量。图92幅,表19个,参考文献202篇。
其他文献
《黄河大合唱》是20世纪新音乐运动领袖人物之一人民音乐家冼星海的重要代表作,它是中国声乐史上特别是中国合唱史上里程碑式的作品。该作品彰显了伟大的爱国精神和崇高的民
目的建立顶空气相色谱法测定工作场所空气中氯化苦的方法。方法用无水乙醇为吸收液,多孔玻板吸收管采集空气中的氯化苦,取吸收液,在温度70℃条件下,顶空加热平衡20 min,采用
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
会议
<正>"互联网+"是利用信息通信技术及互联网平台,让互联网与传统行业相互融合,从而构建新的发展生态。现代信息技术深刻改变着人类的思维、生产、生活、学习方式。在教育领域,
软件可靠性模型,对于软件可靠性估测起着核心的作用。软件可靠性模型是当前软件可靠性工程研究中的热点问题之一。程序正确性证明可以象证明数学定理一样证明程序是正确的,它
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
期刊