论文部分内容阅读
                            
                            
                                聚类是数据挖掘领域中的一个重要研究课题,目前己存在很多经典的聚类算法,但没有任何一种聚类技术(聚类算法)可以普遍适用于揭示各种多维数据集所呈现出来的多种多样的结构。  
 进化算法也是聚类方法的一个分支。目前研究较多的一种进化聚类算法是蚁群聚类算法。蚁群具有许多特有的特性使其能解决无人监督的聚类问题。但蚁群聚类算法也存在一定的局限性,如蚂蚁行走的路径都是对样本数据的一个访问序列,对于复杂密集型的数据集,蚂蚁会在不同簇之间跳跃,这样容易形成很多零碎的簇。如何才能让蚂蚁按照样本数据之间的本质联系构造合适的路径就是需要研究的问题。  
 多目标聚类算法是聚类方法的另一个分支,目前关于这方面研究也正在开展。聚类的过程中存在多个目标函数,且这些目标函数之间是相互冲突的,多目标优化可通过同时优化这些目标函数来达到较好的聚类效果,且在多目标聚类的过程中还可以自动确定合适的聚类数。  
 针对以上所述传统聚类算法存在的局限性以及进化聚类算法和多目标聚类算法的特点,本文作了较深入的研究,取得如下一些成果:  
 1.提出一种基于蚁群系统的聚类算法ACCA(ant colony clustering algorithm),算法引入近邻函数值的概念来确定样本数据之间的相似性,通过蚂蚁在行走过程中不断建立样本数据之间的最相似连接来形成多个子连通图,从而构造簇。实验结果表明ACCA算法聚类效果较好。  
 2.提出了一种多目标蚁群聚类算法MOAC(Multi-objective ant colonyclustering algorithm),算法在ACCA算法的基础上结合了多目标优化算法NSGA-Ⅱ,能基于最优解集自动确定合适的聚类数,得到有效的聚类结果。克服了ACCA算法可能由于参数设置不当而得不出准确聚类数的缺陷。  
 此外,本文在研究蚁群算法用于聚类问题的同时,对于蚁群算法在连续空间的应用也作了一些深入研究:  
 3.提出了一种用于连续函数优化的蚁群算法CFACO(Ant ColonyOptimization for Continuous function Optimization)。该算法使用了划分子区域的方法,蚂蚁可以跨区域移动。既保证全局优化的实现,也能在局部区域内做精确搜索。实验结果表明算法收敛速度快,且能有效地解决蚁群算法易于陷入局部优化的问题。