基于Canopy的K-Means并行化算法

来源 :电脑与电信 | 被引量 : 0次 | 上传用户:dage10
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对大数据带来的海量信息,传统的数据挖掘方法已经不再适用。近些年来很多学者提出新的数据挖掘方式,或者在传统的方法上进行改进,但是还远不足以处理这些海量信息。在总结已有方法的基础上,提出一种基于Canopy的K-Means并行化算法。与传统的K-Means算法相比,本文提出的改进方法会通过密度确定初始中心,然后在Hadoop分布式集群上运行K-Means算法。实验证明,该方法在保证精度的情况下,能降低运算复杂度从而提高计算效率。
其他文献
在单小区模型的场景下,提出了一种基于不同业务服务质量要求的D2D通信频谱资源分配算法QARA。算法设计的过程中,首先通过随机生成的方式,在小区半径内建立蜂窝用户和D2D用户
<正> 今年3月全国技工学校工作会议在天津召开以后,天津劳动局所属第一、第二和勤劳三个技工学校全体人员鼓足干劲,力争上游,在生产上和教学上都创造出了空前的成绩。贯彻动
<正> 評发奖金是企业做好奖励工作的一个重要环节。及时、准确地評发奖金,才能使奖励办法更好地发揮鼓励职工的劳动热情,促进生产的积极作用。当前在企业改进奖励制度的工作
采用超声波辅助水提、乙醇沉淀、DEAE-52阴离子交换层析法从树蝴蝶(Lobaria koorkauae Yoshim)中分离纯化得到多糖LKY-I。采用凝胶渗透色谱法(gel permeation chromatography,GP
<正> 目前,廣州市違法私招現象還是經常發生。特别是在施工紧張時期,私招現象更形嚴重,不少建築單位擅自在市區招僱工人、農民;有的私營建築廠商甚至挖僱國營建築公司的固定
<正>《薇客》寄语:停留在想法里的创业,永远只是想法。温州人号称中国最富有的人群,他们最喜欢挂在嘴边的话就是:"宁愿睡地板,也要做老板。"相信很多人都有做老板的梦,为什么
<正> 我們三九一包車組負責駕駛北京至莫斯科間从哈尔滨到博克图区段的一、二次国际旅客特别快車,常年奔馳在祖国的最北方,任务是光榮而艰巨的。十年来,我們全組同志在党的領
通过拌和试验、湿轮磨耗试验等,测定不同的纤维掺量下纤维微表处混合料的可拌和时间、耐磨耗性及水稳定性等性能,研究纤维掺量对微表处混合料路用性能的影响规律。结果表明,
当前,随着我国经济发展速度的不断加快,建筑工程行业也得到了较快的发展。建筑工程的不断增多,使得施工的效率和工程的质量难免会出现这样那样的问题。此时,做好建筑施工成本管理
深层水泥搅拌桩是处理软弱地基的一种常用有效方法,它是利用水泥作为固化剂通过深层搅拌机械在地基深部就地将软土和固化剂强制拌合,使软土硬结从而提高地基强度,特别适合重力坝