基于文化算法的聚类分析研究

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:zjkghost10
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
聚类分析作为一种信息处理手段近些年来一直受到人们的关注,而且在机器学习、模式识别、数据挖掘、信息检索等很多领域得到了广泛的研究和应用。聚类分析在数据挖掘研究中占有重要的位置。所谓聚类,就是将物理或抽象对象的集合划分成为由类似的对象组成的多个类的过程。聚类分析依据的原则是使同一类中的对象具有尽可能大的相似性,而不同类中的对象相似性较小。文化算法是一种新的进化计算方法,文化进化过程除了传统的进化计算模型具有的群体空间外,增加了一个知识空间和支持这两个空间通信的机制,将文化算法用于聚类分析中,有助于对聚类算法的进一步优化。本文以文化算法为框架,采用K-Means模型为聚类模型,针对聚类问题设计适用于该问题的知识空间、群体空间、接受函数和影响函数,提出文化算法与K-Means算法相结合的混合聚类算法。首先在混合算法的群体空间采用遗传算法,并在知识空间采用形势知识,标准化知识,地形知识三种知识做指导,提出KCAGA算法;然后,在混合算法的群体空间采用进化规划,提出KCAEP算法,针对采用不同的影响函数和不同的知识指导,并分别细化为以下几种算法:KCAEPⅠ,KCAEPⅡ,KCAEPⅠ’,KCAEPⅡ’,KCAEPⅢ和KCAEPⅣ。对知识空间知识的研究表明,在知识空间采用形势知识,标准化知识,地形知识三种知识做指导的方法比仅仅采用形势知识,标准化知识两种知识指导的方法聚类效果更好,对影响函数的改进避免聚类过早收敛于局部解。最后,通过实验对比,表明混合算法对解决聚类问题初始化敏感以及容易陷入局部优化取得很好的效果,并有较好的收敛性,适用于聚类问题的解决。
其他文献
随着网络技术的发展和信息量的激增,信息检索越来越受到人们的关注。而传统的信息检索大多集中在关键字匹配方面,对其语义的处理涉及的不多,因此虽然有较高查全率,但查准率却
网格是构筑在互联网基础之上的新兴分布式计算技术。它通过整合分布在各地的计算、存储和通信资源,为动态变化的虚拟组织的成员提供更为广泛的资源共享。网格是通过集中分散
随着多媒体信息技术和Internet的迅速发展,版权保护问题日益突出。数字水印技术作为信息隐藏技术研究领域的重要分支,也是版权保护的重要手段,己经受到越来越多的关注。其中,数字
学位
优化技术作为一个重要的科学分支,它一直受到人们的广泛重视,并在诸多工程领域得到迅速推广和应用,如规划、工程设计、医疗应用、图像处理和计算机科学等。约束性优化问题也一直
随着地理信息系统(GIS)理论和计算机图形学的飞速发展,三维GIS的建模和可视化成为当前国内外研究的一个热点。作为GIS应用的一个重要领域一城市,其三维模型的可视化和空间分析
传统的配色方法已经不能满足现代社会对染色配色技术的需求,针对这一问题,本文主要对从印染企业获取的实际数据进行相关性分析,最终建立了样本三刺激值CMY与染色染料浓度关系
嵌入式测控系统是当前工业自动化测控应用领域研究的热点之一。近年来,嵌入式Web成为实现嵌入式测控系统主要方式之一。本文利用Freescale公司2004年年底推出的集成了以太网
在多标签分类中,一个样本可能同时包含多个标签,多个标签之间可存在相互重叠。随着数据集的标签维度增高,以及标签稀疏性问题,会导致分类算法的计算复杂度增加,分类性能下降
目前的人工免疫系统大多都是建立在传统免疫学理论——“Self-non-self”(SNS)识别模式的基础上,由于SNS模型本身的缺陷,使得对self集定义中如何保证其不包含任何nonself以及