论文部分内容阅读
聚类分析作为一种信息处理手段近些年来一直受到人们的关注,而且在机器学习、模式识别、数据挖掘、信息检索等很多领域得到了广泛的研究和应用。聚类分析在数据挖掘研究中占有重要的位置。所谓聚类,就是将物理或抽象对象的集合划分成为由类似的对象组成的多个类的过程。聚类分析依据的原则是使同一类中的对象具有尽可能大的相似性,而不同类中的对象相似性较小。文化算法是一种新的进化计算方法,文化进化过程除了传统的进化计算模型具有的群体空间外,增加了一个知识空间和支持这两个空间通信的机制,将文化算法用于聚类分析中,有助于对聚类算法的进一步优化。本文以文化算法为框架,采用K-Means模型为聚类模型,针对聚类问题设计适用于该问题的知识空间、群体空间、接受函数和影响函数,提出文化算法与K-Means算法相结合的混合聚类算法。首先在混合算法的群体空间采用遗传算法,并在知识空间采用形势知识,标准化知识,地形知识三种知识做指导,提出KCAGA算法;然后,在混合算法的群体空间采用进化规划,提出KCAEP算法,针对采用不同的影响函数和不同的知识指导,并分别细化为以下几种算法:KCAEPⅠ,KCAEPⅡ,KCAEPⅠ’,KCAEPⅡ’,KCAEPⅢ和KCAEPⅣ。对知识空间知识的研究表明,在知识空间采用形势知识,标准化知识,地形知识三种知识做指导的方法比仅仅采用形势知识,标准化知识两种知识指导的方法聚类效果更好,对影响函数的改进避免聚类过早收敛于局部解。最后,通过实验对比,表明混合算法对解决聚类问题初始化敏感以及容易陷入局部优化取得很好的效果,并有较好的收敛性,适用于聚类问题的解决。