【摘 要】
:
本文提出了一种基于MapReduce的分布式聚类改进算法,该算法将聚类分两阶段进行,首先改进了Canopy算法,引入梯度变化来确定初始中心点以及最佳簇数,解决了传统算法对初始值的
【基金项目】
:
国家自然科学基金项目(61572438,C119017327).
论文部分内容阅读
本文提出了一种基于MapReduce的分布式聚类改进算法,该算法将聚类分两阶段进行,首先改进了Canopy算法,引入梯度变化来确定初始中心点以及最佳簇数,解决了传统算法对初始值的依赖性以及对聚类个数的不确定性.设置了区域半径并动态改变,避免了聚类过程中的局部最优,并采用了信息熵加权,解决了相似度计算的特征权重的问题.最终结合MapReduce分布式计算模型,设计了算法的并行策略与方案.试验结果表明该算法在准确性、加速比、扩展性上具有良好的性能。
其他文献
胡锦涛总书记6月25日重要讲话中对全党同志提出了"四个坚定不移"的新要求。其中,胡锦涛强调,科学发展,社会和谐,是发展中国特色社会主义的基本要求,是实现经济社会又好又快发
可重构流水信号处理器(Reconfigurable Pipeline Signal Processing Core,RPSC)可以通过层次化可配置流水架构实现多种应用,通过粗粒度的静态配置方式,改变RPSC中基本流水级的
讨论了高考物理电学实验试题中关于滑动变阻器和用伏安法测量电阻两种电路的接线方法,并指出在实验操作过程中如何减小偶然误差.
聚合物发光显示材料具有发光颜色在全可见光区可调、可溶液简单加工及适用于柔性大面积基底的特点,成为目前研究的热点。在聚合物发光薄膜图案化技术中,喷墨打印因为具有加工
与时俱进是思想政治工作的应有之义.在新形势下,思想政治工作要结合新形势、新任务,在内容、形式、方法、手段、机制等方面进行创新和改进,特别是要在增强时代感和加强针对性
针对传统系统预警效果差的问题难以满足当下复杂交通需求,为了解决该问题,提出了轨道交通行业网络故障预警系统设计。设计预警系统硬件结构,分析各个层次预警设备。检测网络
物理学是自然科学的基础学科之一,它同辩证唯物主义的关系极其密切.在中学物理教学中自觉地渗透辩证唯物主义哲学观点,不仅能促进学生树立科学的世界观,而且有助于他们理解掌
通过对细胞生物学实验课程的分析,围绕以技术为中心、形成独立课程体系的方向,开展细胞生物学实验课程教改探索.重点把握几个环节:1)理念为先,大胆探索;2)修改大纲,整合内容;
本文分析了高中生手机使用的现状,指出了高中 生使用手机的现实情况以及产生的影响。然后分析了高中生 对手机使用情况的不同认识,像利与弊的认识、自我约束力的 认识以及实
本文通过结合可信计算技术,并根据未来物联网网络环境下操作系统应用程序相对固定、内核状态相对稳定的特点,设计具有函数标签检测和地址空间检测功能的安全操作系统.该安全