KBAC:一种基于K-means的自适应聚类

来源 :小型微型计算机系统 | 被引量 : 0次 | 上传用户:guofy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
K-means聚类算法存在的主要不足之处之一在于需要用户指定聚类核数目,在一般应用场景下,用户无法给出合适的聚类核数目.另一方面,K-means聚类所具有的可并行化特点非常适合运用到云计算平台上以处理大规模数据样本的聚类任务.本文提出KBAC算法采用K-means算法作为预聚类过程并在云平台上进行实现和优化,能够自适应确定最佳聚类核数目并进行聚类.其核心思想是将样本空间聚类问题转换为图上社团发现问题.理论和实验证明,通过在云计算框架下实现K-means预聚类过程的并行化,KBAC算法能够高效地对大规模数据进行聚类,并获得高质量的聚类结果.
其他文献
跨入21世纪以后,如何在能源有限和环境保护的双重制约下可持续的发展经济已成为人类面临的巨大历史课题。常规能源匮乏以及化石能源对环境的破坏迫使着人们大规模的开发和利用
从1851年伦敦的“水晶宫世界博览会”到2010年的上海博览会,从1896年希腊雅典举办的第一届现代奥运会到2012年伦敦奥运会,我们总可以从中发现会展与城市密不可分的关系。一方面
本研究运用文献法、调查法等方法对世界和中国橄榄球运动的历史、现状进行了研究,对橄榄球运动的内涵与外延进行了探讨,论证了中国橄榄球运动正处于前所未有的历史发展机遇,提出
随着可逆和量子计算的发展,对可逆和量子线路的研究也受到前所未有的关注。但是,由于一些物理约束的限制,大多数量子线路要求量子门只能在相邻的量子位上进行作用,即要求实现
东阳道情历史悠久,极具鲜明的艺术特色;在当代大众文化语境里,它是传统与现代的相结合;传承者融合了现代的表现手法,使东阳道情作为绵延至今的某种精神世界的承载物,给人民大
蛋白磷酸酯酶2A(Protein phosphatase 2A,PP2A)是一种真核生物中最保守的丝氨酸/苏氨酸磷酸酯酶,也是真核生物中含量最丰富的酶之一。它能够对激酶、信号分子等大量细胞内蛋
本文认为,运用现代物流理念和技术,构建专业化、规模化和现代化的生鲜农产品冷链物流体系,是我国当前流通领域亟待解决的问题。以大型鲜活农产品批发市场运营商、大型连锁超
<正>内蒙古自治区敖汉旗大甸子遗址是夏家店下层文化中的中心聚落遗址,它由相邻的居址和墓地两部分组成。作为20世纪100项重要考古发现之一,它对重建上古史,探讨北方和中原地
现代企业面临的品牌生存环境变化莫测、复杂多变,新的市场营销模式和品牌化的挑战使得企业品牌的再定位和二次品牌化策略成为一种必然。品牌长盛不衰的根本在于能不能在消费者
促进社会和谐,全面建设小康社会是党的十七大的基本精神。和谐社会需要和谐教育,而教育公平又是和谐教育的基础。本文从宏观和微观两个层面,阐述了教育公平的基本含义,主张"