【摘 要】
:
随着认识和管理水平的提高,人们对客观世界的描述愈来愈全面,存储的数据量愈来愈大。大量的数据未能充分利用这一现象常常被描述为“数据丰富,但信息贫乏”。为此,决策者迫切
论文部分内容阅读
随着认识和管理水平的提高,人们对客观世界的描述愈来愈全面,存储的数据量愈来愈大。大量的数据未能充分利用这一现象常常被描述为“数据丰富,但信息贫乏”。为此,决策者迫切需要能从海量数据库中提取有价值知识的工具,数据挖掘技术正是为满足上述要求而产生的。分类是数据挖掘研究的重点和热点之一。本文总结了主要的分类算法。现有研究表明:在当今数据量不断膨胀的时代,算法的执行速度、可扩展性以及输出结果的可理解性等特性更为重要。在众多的分类算法中,决策树算法特别适用于数据挖掘,是最为广泛使用的分类算法之一。本文总结了有代表性的决策树算法。决策树算法中的SPRINT算法因为具有完全不受内存的限制,生成的决策树较为紧凑和准确,易于实现并行化,以及较好的伸缩性、加速性和扩容性等优点,成为了数据挖掘中优秀的算法之一。本文研究了如何用C++语言实现SPRINT算法。实验表明:编写的程序具有良好的准确性和伸缩性,较好地实现了SPRINT算法。此外,本文研究了如何提高SPRINT算法建树速度,提出了一种提高SPRINT算法建树速度的新方法。新方法的基本思路是:利用算法使用者提供的属性值域信息将属性分为可优化属性和一般属性,然后根据属性是一般属性还是可优化属性分别采用不同的方法改进SPRINT算法构造决策树的过程以提高其建树速度。实验表明:本文提出的新方法不仅能有效地提高SPRINT算法的建树速度,而且在某些方面要优于已有的改进方法。
其他文献
目的:现代医学气质学说研究已有了相当的深度,在新疆地区尚未见到关于气质类型的调研,本次在西北燥证(新疆)流行病学调查中,同时进行了气质类型的调研,旨在探讨气质禀赋与西
分别以氧化锌和硫磺作为溴化丁基橡胶(BIIR)的硫化剂,分析其单独使用和复合使用时对BIIR性能的影响规律.结果表明,氧化锌硫化BIIR时,能降低硫化胶的返原;采用复合硫化时,硫化返
本论文通过对国内外非接触检测技术的发展及现状的研究,提出了以CCD(即电荷耦合器件)摄像方式来获取轴类零件检测信息的方法。并通过MATLAB软件对采集到的轴类零件图片进行图
考虑地震作用下胶凝砂砾石坝的响应特点,采用Instron1346伺服刚性材料试验机,对6个配比72个试件的CSG材料在应变速率10-5~10-2/s范围内进行动态单轴压试验,得到不同应变速率
为观察针药结合治疗偏头痛的临床疗效,将120例患者随机分为2组,各60例。治疗组采用针刺结合布洛芬治疗,对照组采用常规剂量布洛芬治疗。疗程30天。结果:治疗后,两组临床评分
<正>请问:我大学毕业被一家机电公司录用后,要求签订劳动合同,但该公司却要求我先在一份试用期劳动合同上签字,该合同约定期限为2个月。该公司说,按照《劳动法》规定先对录用
生物降解性高分子材料是当今高分子材料领域的研究热点之一。淀粉作为一种天然高分子由于来源广泛、价格低廉和具有易生物降解等特点,在生物降解高分子领域占有重要地位,但是
<正>深圳第二实验学校是深圳市第一批智慧校园试点学校、全国现代教育技术实验学校、全国第一批教育信息化试点单位。学校创建"先学后导-问题评价"有效教学智慧"云课堂",以PA
据营养学家调查表明:我国老年人从食物中摄取的钙质,一般都未达到实际需要量(每天1000-1500毫克)。而
According to nutritionists survey showed that: China’s elderly i