论文部分内容阅读
群智能优化算法是模拟自然生物种群智能行为的优化方法,具有良好的寻优性能。该算法具备易于理解与实现的特点,相比传统的解决方法,在解决大规模复杂优化问题时效果显著,备受国内外研究者的普遍关注。随着信息技术发展与数据库的广泛应用,人们从海量数据中获取所需要的有用信息变得至关重要,数据挖掘成为当今一个前沿研究课题。聚类分析作为数据挖掘的关键分支模块,是认识和分析数据的一种重要研究方法,目前广泛应用于工程设计、信息管理、市场分析等众多的研究领域,推动人类社会不断进步。本文主要对群智能优化算法结合聚类分析进行研究,重点对粒子群优化算法与布谷鸟搜索算法进行了改进,结合优化初始簇中心选择的K-均值算法,并分别应用于聚类分析。实验测试表明,聚类效果明显优于传统群智能算法与聚类算法,从而在某种条件下可以达到良好的聚类应用效果。本文从下面几个要点展开研究:第一,充分分析了群智能优化算法与聚类分析的研究现状、基本理论,并介绍K-均值聚类与K-中心点聚类两种经典算法。重点研究粒子群优化算法及布谷鸟搜索算法,并应用于聚类分析。第二,针对粒子群优化算法易于陷入局部解的不足,考虑在粒子更新公式中加入邻域扰动项,算法遵循自适应优化学习策略增强全局搜索性能,防止粒子早熟。且初始簇中心选择对K-均值算法的影响较大,根据“集群度”思想实现优化初始簇中心,优化初始粒子选择并拓展邻域搜索范围,提出一种融合邻域扰动的简化粒子群K-均值初始优化聚类算法(ADPSO-IKM)。通过典型数据集的仿真测试表明,ADPSO-IKM算法能加快收敛速度,精确度高且稳定性好。第三,针对布谷鸟搜索算法后期收敛速度慢的缺点,融合粒子群算法思想并遵循自适应优化学习策略,同时引入自适应度步长调节因子与动态变化发现概率,均衡算法全局与局部精细搜索能力,结合基于“集群度”与距离均衡优化选择初始簇中心的K-均值算法,提出一种自适应调整的布谷鸟搜索及优化初始K-均值聚类算法(CSSA-OIKM)。仿真实验证明了CSSA-OIKM算法较好的聚类收敛效果。