论文部分内容阅读
目前,粒子群优化算法已广泛应用于模式识别、垃圾邮件检测、数据聚类、机器人技术、推荐系统等很多领域。然而,在不同的应用背景下,传统的粒子群优化算法在有效性验证、速度位置更新规则、收敛性能等方面仍存在急需深入解决的问题。因此,本文针对聚类有效性指标、聚类算法以及复杂社团检测应用场景三个关键问题,提出动态终止聚类过程的聚类有效性指标,着重研究基于粒子群的聚类分析算法及复杂网络社团检测算法。本文主要研究工作如下: 1、根据本文提出的多种聚类度量,提出了一种动态确定最佳聚类数的有效性评估方法,该方法采用本文提出的有效性指标—距离平方和差值比RDSED。根据之前提出的距离平方和差值DSED来计算RDSED值,并动态终止最佳聚类数搜索过程。人工数据集和真实数据集上的实验结果表明本章提出的RDSED指标和方法,能够有效地评估聚类划分结果并确定最佳聚类数。 2、研究提出了一种基于PSO和K均值的混合聚类算法KIPSO,与传统粒子编码方案不同,KIPSO算法使用一种简约粒子编码方案,同时对数据进行预处理,采用数据对象与类簇中心的平均距离作为适应度函数。算法融合了PSO算法和K均值算法,具有PSO较强的全局寻优能力,又有K均值的局部搜索能力。人工和真实数据集的实验结果表明,该方法更加精确并有更好的收敛性能。 3、提出了一种基于进化策略的离散粒子群复杂网络社团检测算法,该算法重新定义了粒子的速度位置和更新方式等,并采用了避免陷入局部最优的两种进化策略。GN基准网络数据集和真实网络数据集上的实验证明该算法能够有效发现网络社团,具有稳定的社团划分质量和全局收敛性。 本文研究贡献:从分离性度量和紧密性度量等方面衡量聚类有效性验证过程中各指标相异性,并动态终止验证过程;对传统基于PSO的聚类算法进行优化,定义新型离散应用场景下的基于PSO的复杂网络社团检测算法。并通过多组实验验证了所提方法和算法是有效可行的。