【摘 要】
:
随着数据挖掘分类技术的广泛应用,决策树在数据挖掘技术中的作用越来越重要,并且取得了众多的研究成果。实际应用中由于存储数据量爆炸性的增长,使许多算法挖掘效率下降,而传
论文部分内容阅读
随着数据挖掘分类技术的广泛应用,决策树在数据挖掘技术中的作用越来越重要,并且取得了众多的研究成果。实际应用中由于存储数据量爆炸性的增长,使许多算法挖掘效率下降,而传统的决策树算法已经不能很好的从海量的数据中找出有用的信息,使得它的应用受到了一定的局限性。为了解决决策树算法应用的局限性问题,本文着重对决策树挖掘算法进行了研究,在现有算法的基础上对SPRINT算法进行改进,并运用改进的算法对影响本科生创新能力的主要因素进行挖掘。主要的研究工作集中体现在以下几个方面:(1)对经典决策树算法的理论和实现原理进行了研究;深入分析了SPRINT算法,针对该算法的不足进行了改进,并将改进算法与原有算法进行了测试;对Eclipse开发平台的结构和Weka平台的结构、功能、内核进行了分析。(2)在上述研究的理论方法的基础上,对SPRINT算法中关键的成员变量、方法以及数据结构进行设计,根据规则建立分类器,将SPRINT算法封装进Weka平台中,并通过实例将封装的SPRINT算法与Weka平台自带的J4.8算法(即C4.5算法)进行比较测试。(3)将封装的SPRINT算法应用到学生创新能力挖掘中,对分类的结果进行分析,总结出学生创新能力与教学方法的之间的关系,为教师指导学生提供决策支持。(4)最后对改进的SPRINT算法的理论思想和实验原理进行了详细的总结,同时对论文存在的问题做了说明,展望下一步的工作。
其他文献
文本无关电话语音的说话人身份确认的研究,以其实用性,成为当今语音识别领域中的热门课题。当今文本无关说话人确认的主流技术是以高斯混合模型(GMM)为代表的概率统计模型,由于G
星地双基地SAR系统是一种新的双基地SAR体制,具有作用距离远、安全性好、隐蔽性强、获取目标信息丰富、抗干扰性能好等优势。另外,由于其利用现有的SAR卫星作为发射源,使系统
联想记忆(AM)是生物智能的重要机制和人工智能的研究焦点。本文基于小世界体系,提出并研究了一种新型联想记忆模型,并基于所建模型开展了相关的理论研究、算法研究、模拟研究和
随着科技的发展,各行业的管理手段从人工逐步转变成自动或半自动方式。尤其在化工、冶金等行业,以及较恶劣环境下进行实时监控时,为了提高生产率和减少人为因素造成的误判,需采用
石油是现今最为重要的天然能源,直接关系到人们的生活和国家安全。随着国民经济的高速发展,我国的石油需求也逐年递增。但是,国内的石油产量却不能满足国内的需求,石油缺口需要进
目的:探讨对新生儿黄疸患儿采用短时多次蓝光照射疗法进行治疗的效果.方法:将2017年1月至2019年5月期间在新疆阿勒泰地区人民医院新生儿科接受治疗的80例新生儿黄疸患儿作为
随着现代科学技术的发展,智能手机等智能终端的普及使我们的生活更加方便快捷,设备智能化的概念已经深入人心,与我们关系最紧密的家居生活也已变得越来越智能。然而,标准的不严格
近年来,随着LCD、PDP等平板显示技术的发展,数字显示接口替代传统的模拟接口己成为必然趋势。数字视频接口(Digital Visual Interface,DVI)是由Silicon Image、Intel、Compaq、I
积分方程方法中的矩量法因为计算精度高,因此被广泛应用于计算分析目标的电磁散射特性。本文主要研究了基于积分方程方法的双线性基函数,其目的在于提高积分方程方法的求解精度
基于多输入多输出(MIMO)的空时编码技术将信道编码和天线分集相结合,能在不增大发射功率和扩展频带的前提下提高无线衰落信道的通信系统的容量和质量,满足未来无线移动通信对