【摘 要】
:
近年来,数据挖掘已发展成为一门炙手可热的学科,南京检测中心作为国家级检测单位,目前使用的综合信息系统主要是面向工程建筑材料的检测,挖掘出信息系统中的隐藏价值,对于检
论文部分内容阅读
近年来,数据挖掘已发展成为一门炙手可热的学科,南京检测中心作为国家级检测单位,目前使用的综合信息系统主要是面向工程建筑材料的检测,挖掘出信息系统中的隐藏价值,对于检测中心发展具有重要意义。本文首先是对综合信息系统相关技术进行研究,主要包括数据挖掘技术、决策树算法和Weka平台,基于Weka平台比较ID3算法与C4.5算法,将检测系统中的检测数据作为实验数据集,由实验结果得,C4.5算法不仅可以处理连续属性,并且在处理离散属性时,C4.5算法相对于ID3算法有更高的精确度,但是因为C4.5在构造决策树过程中,需要多次对数据集进行扫描和排序,从而导致算法的低效,本文提出一种选择模式,即在当数据集不大且精确度要求较高情况下,首选决策树C4.5算法,当数据集相对内存较大且精确度要求一般的情况下,首选ID3算法。随后本文针对检测系统中检测材料没有等级分类标准的问题,在基于Weka平台的情况下,对检测数据进行预处理,并且筛选检测材料属性,运用C4.5算法构建一棵关于检测等级分类的决策树,并由实验结果中分类错误实例图挖掘出潜在的信息,提出把检测时间更加精确化的记录和去除检测等级“E”的建议,从而提高检测设备利用率和精确度。最后本文针对决策树C4.5算法在处理连续属性时没有增量学习这一问题,结合后向传播算法提出改进方案,由实验结果可知,在一定范围内,数据集越小时改进效果越明显。本文是从多角度出发,在研究C4.5算法的基础上,面向工程的综合信息系统提出了合理化的建议,意在提高检测设备利用率和精确度,本文整个挖掘流程也适用于其它综合信息系统。
其他文献
小熊猫是我国二级保护动物,具有独特的生态学价值和观赏价值,许多动物园都引进饲养,随着圈养数量的增加,疾病引起的死亡报道也不断增加。致病性大肠杆菌是临床最常见的病原菌
杜甫诗歌千汇万状,目光所至皆能入诗。杜甫诗歌中,花草树木、鱼虫鸟兽、山川河海无一不沾染着诗人自身的体会和情感。杜甫笔下的动物意象研究是杜诗研究中不可缺少的一部分。目前学术界对杜诗动物意象的研究主要集中在某个单个意象的研究上,或者是与其他诗人动物意象的横向对比上,缺少系统研究。本文在前人基础上选取了马、龙、凤三个始终贯穿杜甫诗歌创作的代表性意象,通过纵向、横向的研究对比,以小见大地探讨杜甫心境转变、
在日常的教学中,教师们发现好的试题对学生知识的理解、内化、升华有着事半功倍的效果.那么试题是怎么构思出来的?本文对此做了一些探索和思考.主要从改变条件和结论为位置,
近年来,随着重大火灾事故不断频发,给人们的生活带来了严重的影响。火灾大多发生在高层建筑中,因高层建筑楼层较为复杂,对火灾人员疏散造成严重影响,而人员疏散作为消防救灾
<正> 十四世纪下半叶初期,大蒙古帝国在内部矛盾的压力下和奋起进行解放斗争的欧亚各国人民的打击下,终于退出了历史舞台。这一事件引起的后果之一是西欧人与蒙古和中央亚保
摘要:数据驱动学习法运用于对外汉语多义词教学中是一项创举。本文主要探讨了数据驱动学习法的特点及其在对外汉语教学中的应用,并提出了此方法存在的一些不足之处。 关键词:数据驱动;对外汉语;多义词 中图分类号:G642.0 文献标志码:A 文章编号:1674-9324(2017)15-0168-02 一、数据驱动学习法简介 1.数据驱动学习法的定义。语料驱动学习(Data-driven Lear
近年来,高校扩招力度不断加大,毕业生就业形势严峻,构建高校毕业生“全过程服务”就业指导体系研究提出了有利于就业的政策建言,这将对实现大学生充分就业、维护社会和谐稳定起到