基于粒子群优化的聚类分析三个关键问题研究与应用

来源 :南昌大学 | 被引量 : 0次 | 上传用户:sory520
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目前,粒子群优化算法已广泛应用于模式识别、垃圾邮件检测、数据聚类、机器人技术、推荐系统等很多领域。然而,在不同的应用背景下,传统的粒子群优化算法在有效性验证、速度位置更新规则、收敛性能等方面仍存在急需深入解决的问题。因此,本文针对聚类有效性指标、聚类算法以及复杂社团检测应用场景三个关键问题,提出动态终止聚类过程的聚类有效性指标,着重研究基于粒子群的聚类分析算法及复杂网络社团检测算法。本文主要研究工作如下:  1、根据本文提出的多种聚类度量,提出了一种动态确定最佳聚类数的有效性评估方法,该方法采用本文提出的有效性指标—距离平方和差值比RDSED。根据之前提出的距离平方和差值DSED来计算RDSED值,并动态终止最佳聚类数搜索过程。人工数据集和真实数据集上的实验结果表明本章提出的RDSED指标和方法,能够有效地评估聚类划分结果并确定最佳聚类数。  2、研究提出了一种基于PSO和K均值的混合聚类算法KIPSO,与传统粒子编码方案不同,KIPSO算法使用一种简约粒子编码方案,同时对数据进行预处理,采用数据对象与类簇中心的平均距离作为适应度函数。算法融合了PSO算法和K均值算法,具有PSO较强的全局寻优能力,又有K均值的局部搜索能力。人工和真实数据集的实验结果表明,该方法更加精确并有更好的收敛性能。  3、提出了一种基于进化策略的离散粒子群复杂网络社团检测算法,该算法重新定义了粒子的速度位置和更新方式等,并采用了避免陷入局部最优的两种进化策略。GN基准网络数据集和真实网络数据集上的实验证明该算法能够有效发现网络社团,具有稳定的社团划分质量和全局收敛性。  本文研究贡献:从分离性度量和紧密性度量等方面衡量聚类有效性验证过程中各指标相异性,并动态终止验证过程;对传统基于PSO的聚类算法进行优化,定义新型离散应用场景下的基于PSO的复杂网络社团检测算法。并通过多组实验验证了所提方法和算法是有效可行的。
其他文献
随着无线通信技术的不断发展,作为无线通信载体的频谱资源短缺的问题也越来越严重。经过研究发现,造成频谱短缺的根本原因是传统的固定频谱分配方式造成的,所以动态频谱分配
即时通讯软件(如短信、微信、QQ、微博等)会产生海量的交互信息数据,它们与以往的数据有很大的不同,其以会话形式存在,主要特点在于数据中包含两个或以上的用户的消息。这些
近年来,金属矿山安全生产管理水平逐渐提升,但各类安全事故时有发生。在井下金属矿山突发灾难事故时,由于救援措施的迟滞性、矿工对于井下作业环境不熟悉等因素,从而给矿山带来了
近年来,随着无线通信技术和电子器件技术的发展,无线传感器网络(Wireless SensorNetworks,简称WSN)成为人类日益关注的新兴技术。无线传感器网络不需要固定设施,由大规模的传感器
随着网络移动终端用户数量急剧增长,如何保证网络终端用户在移动环境下的安全性成为研究的热点问题。HIP是一种综合解决主机移动性和安全性的有效方案,但其移动性管理实现机制
随着信息成为企业生存发展的关键因素,从海量数据中提取和分析信息进而支持企业决策交得越来越重要。数据仓库作为分析海量数据的重要工具而备受关注。   今天,传统数据库管
在生物信息学中,基于基因表达微阵列数据的分类模型以及特征选择算法已成为机器学习和数据挖掘领域的研究热点。由于基因存在共调控现象,即存在一系列共同发挥作用的基因,从
随着信息安全事件的频繁出现,用户对医疗信息的访问控制与隐私保护需求越来越迫切。但是,现有医疗信息的安全机制,特别是在分布式环境下的安全机制却非常薄弱。因此,针对医疗
随着信息领域的飞速发展,Internet及建立之上的各种应用对人们的生活、企业的发展和社会的进步都产生了巨大的影响。无线技术的不断进步,使各种移动终端被大量应用。在IPv6的
软件测试是保证软件质量的重要手段,自动化测试作为一项新技术被提出并广泛研究,它能有效地解决传统软件测试所存在的问题并提高测试效率。Web自动化测试作为自动化测试的一个