基于Hadoop的仿射传播大数据聚类分析方法

来源 :计算机工程与应用 | 被引量 : 0次 | 上传用户:flyballball
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
仿射传播聚类算法(AP)是一个新的聚类分析方法,已经被广泛应用于各种领域。APC算法不能用于大型数据的分析。为了克服这个限制,在Hadoop分布式框架的基础上提出一种改进的放射传播聚类分析方法(基于Hadoop的仿射传播大数据聚类分析方法,简称APCH)。通过在Hadoop环境下重新设计算法流程,APCH算法成为了一个并行化的大数据聚类分析方法。此外APCH算法能够高效操作大数据,并能够直接决定聚类的个数。为了验证方法的性能,在多个数据集上进行了实验。实验结果表明APCH对大数据处理有很好的适应性和延展性。APCH采用开源的方式提供可执行软件程序和源代码,用户可以下载后部署在自己的分布式集群中或者是部署在亚马逊EC2等云计算环境中。所有编译后的执行程序,源代码,用户手册,部分测试数据集均可以从https://github.com/Hello World CN/Map Reduce APC上下载。
其他文献
目的探讨健康管理在基层部队实施的可行性。方法根据体检结果和亚健康问卷调查情况,综合分析实施健康管理前后指标的变化情况。结果通过健康管理的实施,影响官兵健康的高脂血症
<正>我国已经广泛开展了新生儿及婴幼儿早期听力检测及干预〔1-3〕,听力障碍的婴幼儿(以下简称听障婴幼儿)在出生时能够得到筛查,3个月内被诊断,6个月内得到适当干预〔2〕。
新的知识传播技术给网络版权保护带来新的冲击。传播技术创新与网络版权保护的冲突在于传播技术创新使版权"技术控制"失效、"授权控制"失效、"关系控制"失效、"商业价值控制"
在现实生产中,生产调度和设备维护具有相互影响的关系,应将两者统筹优化。在理论研究中,柔性车间调度和设备维修决策的联合优化问题尚鲜有研究。为解决这一问题,以车间调度理
坚持把“三严三实”内化于心,外化于行,从加强高校领导干部自身建设,队伍建设和制度建设等方面,立根固本,落细落小,修枝剪叶,从诛如流,从严从实转变作风,有力加强高校干部工
电影《亲爱的》沿袭了陈可辛一贯的艺术风格,在有限的叙事范围之内牵引出一系列深沉而又多元的叙事子题,显示了主创超凡的叙事策略;又通过多重视角的层层透视揭示镜像现实的
本文从理论背景入手梳理翻转课堂的发展沿革,通过分析翻转课堂教学模型探讨了翻转课堂的核心意义,为推进翻转课堂在我国不同学科中的开展做出基础性研究。
目的探讨氯吡格雷抵抗的患者更换为替格瑞洛后其抗血小板聚集效果。方法本研究入选了63例经血栓弹力图结果证实存在氯吡格雷抵抗患者。所有患者均接受经皮冠状动脉介入治疗,
根据古敢水族文化旅游资源的空间分布现状,运用平面构成理论,构建了古敢水族文化旅游发展的模式。即"一带、四区"的总体格局。