【摘 要】
:
决策树是数据挖掘中非常重要的一种技术,常用来做数据分析和预测。传统的决策树算法在处理海量数据挖掘时,受到CPU和内存的限制,导致算法存在消耗时间过长,容错性差,存储量小
【基金项目】
:
国家自然科学基金资助项目(CZ211018)
论文部分内容阅读
决策树是数据挖掘中非常重要的一种技术,常用来做数据分析和预测。传统的决策树算法在处理海量数据挖掘时,受到CPU和内存的限制,导致算法存在消耗时间过长,容错性差,存储量小的缺点。面对海量数据的处理,云计算在这方面具有非常多的优势。针对决策树中优秀的SPRINT算法,首先对SPRINT算法进行了优化,然后为了让优化后的算法更好地应用于云计算,对算法实现了并行化。传统的SPRINT算法在生成决策树时,会发生多值偏向问题,在生成一个节点时,通过计算两层的Gini指数来降低多值偏向的影响。在算法并行化时,通过将数据
其他文献
真理是发现的,还是创造的,对这一问题的回答决定着我们对真理中所包含的价值维度的认可与否。通过从国外研究动态、国内研究动态两个方面阐述马克思实践真理观人文维度的研究
本文采用同位索标记萃取方法,选用柠檬酸(cit),酒石酸(tar)及甘氨酸(gly)为配体(L).主要对 Cr(Ⅲ)/L、Cr(Ⅲ)/RE(Ⅲ)/L 及 RE(Ⅲ)/L 体系进行了对比研究,结果表明,当配体分别
日本文部科学省日前决定,从2007年起利用5年时间强化覆盖东京及周边地区的地震观测网,详细调查这一区域的地下构造,以防范可能发生的首都直下型地震。
针对目前COX(环氧合酶)抑制剂较少且抑制效果差的问题,以及传统的化学实验筛选COX抑制剂分子的方法中成本高且效率低的问题,基于机器学习算法,提出并建立了一种COX抑制剂的预测模
2017年12月份,南京一大厦旧电梯的拆除工程,电梯失控发生坠落,最终电梯轿厢坠落至底坑,导致轿顶施工人员一死一伤。文章分析了电梯失控发生坠落的原因,并提出相关性建议以供参考,对
机电设备被广泛应用在很多行业,以建筑行业来说,设备安装是建筑建设的重要环节,直接影响建筑施工以及运营后的性能。但是就当前机电设备安装项目存在很大的不足,其中主要原因就是
平衡行政权力和学术权力应该成为治理下的当代大学的自主价值选择。通过历史透视,发现过去广播电视大学内部一直处于行政权盛于学术权的失衡状态,这将严重削弱今后转型为开放大
布袍萧索鬓如丝──《蒲学史》引论徐恭时一、蒲学引[一代文星]:在我国清初的文坛上,出现了三位闪耀于斗牛之间的文星和三部驰名遐迩的小说,就是:蒲松龄(1640-1715)的《聊斋志异》①,曹雪芹(1715-1764)的《
随着我国科技的不断创新发展,电子自动化技术受到了广泛的关注,同时电气自动化控制技术也被应用到了 社会发展的各个领域中,并取得了一定成绩。房建工程最为我国城市化发展的
在信息化时代,什么最重要?似乎一个不容争议的答案是信息,然而比信息更重要的是人们对信息的态度。什么样的态度对我们适应信息化最有利?显然,一个比较可靠的答案就是学习!