【摘 要】
:
制造工业产品缺陷的分析是改进企业产品制造过程的重要途径之一,对于产品质量以及营销收益有着重要的研究意义和应用价值。伴随计算机技术的快速发展、自动化系统的全面部署,
论文部分内容阅读
制造工业产品缺陷的分析是改进企业产品制造过程的重要途径之一,对于产品质量以及营销收益有着重要的研究意义和应用价值。伴随计算机技术的快速发展、自动化系统的全面部署,产品制造过程中信息采集和存储的难度大大降低。具有潜在信息和价值的数据在不断地积累。同时,机器学习、数据挖掘等方法在各行各业取得了飞速的发展和应用。然而制造业由于工业性质对这些数据的利用水平远不如其它行业,并没有真正地发挥这些数据应有的价值。为此,本文针对制造工业品数据的主要特点,总结了一般的针对工业产品缺陷分析问题的处理流程,对数据进行处理以及统计分析,并将分析产品各项质量检测结果与产品的缺陷数据之间的关系问题,转化成通过统计学习方法建立产品质量与缺陷的分类模型。然而缺陷数据同时出现多个缺陷类别以及类别样本数目不平衡的问题,这对分类算法模型的构建而言是一大阻碍。本文针对需要同时扫清该两者障碍提出了结合代价敏感与集成方法的多分类器模型,通过样本重赋权重再缩放的方法结合分类代价敏感,再集成多个决策树构建多分类模型。实验结果表明该模型可以有效地处理不平衡类别的多分类问题,同时可以平衡分类代价和预测的准确率。此外对决策树的集成拟合可以得出相关属性的重要性度量,可以作为追溯缺陷主要影响因素的一个依据。
其他文献
当前,指纹识别仍然是一个研究热点。经过国内外同行的多年努力,指纹识别在越来越多的领域得到了广泛的应用,但是指纹识别中仍然存在许多问题,如高安全应用问题,多模板集成问
数据流挖掘是当今的热点问题之一,具有广阔的发展前景。离群点检测是数据挖掘的基本任务之一,具有非常重要的研究价值,始终受到研究人员的重视。虽然传统静态数据集的离群点检测
随着计算机技术的快速发展,智能交通系统成为了世界各国的研究热点,它是解决交通问题的一个有效办法,为交通管理的发展指明了方向。智能交通系统将先进的信息技术以及计算机技术
随着信息化程度的不断提高,海量的数据存在于实际的应用中。但海量的数据中往往存在大量的冗余,所以,剔除这些冗余可以大大提高数据的处理能力。作为一种处理不精确、不一致
随着互联网的飞速发展,随着手机、数码相机、平板电脑等移动设备技术的不断进步,越来越多的图像、视频等媒体不断涌入互联网并且持续传播扩散。面对如此大规模的Web图像数据,
计算机技术的出现,使得医学领域发生了重大变化,十九世纪五十年代计算机技术就已经应用在病历管理上,其后是财务管理、病房监护等等。而计算机成像技术快速发展,使得图像处理技术
基于视觉的手势识别技术以自然而又直观的人手作为输入方式,提供给用户更加和谐、自然的交互方式,它一直是人机交互的重要研究课题,具有广阔的实际应用前景。近年来,随着计算
随着大规模网络开放课程的飞速发展,在线教育这一全新的学习形式开始被越来越多的人所接受。用户通过互联网可以学习到各种领域的知识和技能,但随着在线课程资源数量的增加以
在大数据时代背景下,电子商务、第三方支付等线上业务爆发式增长,随之而来的是日益猖獗的线上欺诈案件,在线欺诈检测技术作为企业风控能力的基石,通过对业务行为建模,更加精
在实际应用中,数据集通常包含正常数据和离群数据,相对于正常数据而言,离群点的产生机制往往与之不相同,所以离群点可能蕴含着重要的信息,研究离群点的内涵知识具有重要学术意义和