基于改进人工蜂群的K均值混合聚类算法及其应用

来源 :江西理工大学 | 被引量 : 0次 | 上传用户:xxhaizi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着科学技术的飞速发展,人们的生活中充斥着各种各样的信息,在面临从这种海量信息中提取有价值的知识的问题上,很多工作往往需要对大数据量的数据进行聚类分析。作为一种最经典的划分聚类算法,K均值算法应用广泛、算法思想简单易实现,聚类快速能够处理大数据集。但是,K均值聚类算法自身也存在一些不足:聚类结果过分依赖初始点的选择,全局搜索能力较弱,易陷入局部最优解。与此同时,日益发展的群体智能技术也因其自有的优良特性而被运用到改善聚类性能问题上。人工蜂群算法具有简单易实现、全局寻优能力强、所需控制参数少等特点。所以本文在前人的基础上,首先对人工蜂群算法进行改进,再将其与K均值算法有效的结合,最后通过仿真实验并应用在复杂网络的社区划分问题上,证明改进算法的有效性,具体工作如下:(1)种群初始化在人工蜂群算法中极为重要,初始化的好坏直接关系到算法后期的迭代时空复杂度。针对人工蜂群算法初始化随机性问题,本文提出一种最大最小距离积算法用于种群的初始化,克服原算法的初始化的盲目性和随机性。(2)针对人工蜂群算法在迭代后期容易出现收敛缓慢的问题,本文提出一种基于全局影响因子的位置更新公式。该公式在保证蜂群具有较强的开采能力的同时,也提升了其探索能力。同时为与K均值有效结合,这里提出一种基于K均值聚类过程的适应度公式,从而能够能精确地引导种群的进化方向,提高了人工蜂群算法的健壮性。(3)将改进后的人工蜂群算法与K均值算法结合得到混合聚类算法,利用改进算法的特性有效克服了K均值算法全局搜索能力差以及依赖初始中心点的缺陷。(4)将改进的混合聚类算法用于复杂网络的社区划分问题上,将社区划分问题转换为聚类问题。通过在数据集Karate、Dolphins和Football证明了此应用的合理性。通过在各数据集上的实验结果表明,基于改进人工蜂群算法的K均值混合聚类算法具有较强的全局搜索能力和较好的稳定性,且聚类精度较好,速度有明显提升,同时能够有效地解决社区划分问题。
其他文献
近年来随着P2P系统的大量出现,P2P技术逐渐成为人们研究的热点。P2P技术目前主要应用在资源共享、分布式计算、协作系统、电子商务和以P2P为基础的深度搜索引擎等方面。其中,信
移动机器人是机器人学中的重要分支,对它的研究属于多学科相互交叉,相互渗透的前沿课题,因此具有很大的理论价值和广阔的应用前景。机器人导航代表一种高层智能。在避开障碍物的
本文介绍基于Visual.net2005+XML的移动机器人视觉导航仿真平台的设计与实现。首先讨论了该仿真平台的系统结构,描述了平台各部分的设计,其中特别介绍了仿真平台的相关接口。然
随着多媒体技术的发展,图像信息应用越来越广泛,人们对于图像等多媒体数据的需求也越来越强烈。图像具有丰富的高层语义,高层语义概念更符合人们对图像的理解,基于语义的图像
互联网以其信息生产的自主性、信息传播、获取的便捷性、地域覆盖的广泛性,辅以低廉的运行维护成本,自上世纪90年代中期开始大发展以来,迅速成为政务、商务、教育、娱乐等一
软件测试作为保证软件质量,提高软件可靠性的重要手段,在软件开发中起着不可替代的作用。随着计算机在各个领域的普及,软件规模的增大和开发模式的变化,测试的工作量也随之不
目前,国家对高端容错计算机的依赖程度日渐增加。高端容错计算机研制的目标是面向国家关键应用领域,一方面具有极强的事务处理能力,另一方面具有极高的可用性,可长期提供高速
本学位论文研究的出发点是为了解决教学中计算机语言课程编程测试的问题,这个出发点也是研究和开发基于网络环境下计算机语言实验考试系统的主要目的。计算机语言实验考试系
计算机技术的发展和Internet的普及,使多媒体通信发展到一个前所未有的高度,人们可以通过Internet发布数字作品、进行网络交易等活动,但随之而来的侵权盗版活动也日益猖獗。因此
本文从嵌入式软件UI框架的实际问题出发,设计并实现了一个适用于嵌入式系统的,具有良好可移植性、灵活性和可扩展性的GUI框架。该GUI框架还具有支持Alpha混合描画、抗锯齿字