近邻传播聚类算法研究

来源 :解放军信息工程大学 | 被引量 : 16次 | 上传用户:tianhaiyandml
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近邻传播算法(AP)是近年出现的一种在数据挖掘领域极具竞争力的聚类算法,相比较于传统聚类算法,AP算法能够在较短时间内完成大规模多类别数据集的聚类,且该算法能够很好地解决非欧空间问题。因此,AP算法自提出以来,受到了广泛的关注和应用。尽管如此,AP算法仍然存在两个主要缺陷:1)AP算法只适合处理紧致的超球形结构的数据聚类问题,当数据集分布松散或结构复杂时,该算法不能给出理想的聚类结果;2)AP算法是一种无监督的学习方法,不能直接适用于有约束条件的聚类问题。本文针对上述问题展开专门研究。论文从改进相似度矩阵入手,首先针对部分聚类数据密度不同以及线性不可分的问题,提出核共享近邻传播(KSAP)算法;进而针对任意形状任意结构的簇的聚类问题,提出基于流形距离的近邻传播(APMD)算法和混合核模型的APMD算法(MKAPMD);最后,针对约束聚类问题,提出基于成对约束的半监督近邻传播(SAP-PC)算法。本文的主要创新点包括:1)提出核共享近邻传播算法。针对传统基于欧式距离的相似性度量只能聚类紧致结构数据集的缺点,利用数据间共享最近邻数量对局部密度不敏感的特性,设计了一种基于高斯核的共享近邻相似性度量,并据此提出了核共享近邻传播算法。仿真结果证明:该算法能够解决密度不均匀和部分简单线性不可分的数据集聚类问题。2)提出基于流形距离的近邻传播算法。针对现有AP算法只能发现超球形聚类的缺点,依据聚类的局部一致性和全局一致性假设,设计了一种局部保持的流形距离度量方法,据此提出了APMD算法,该算法可以发现任意形状的类簇。在此基础上提出了一种快速APMD算法,该算法在保持聚类性能的同时大大提高了算法运算速度。仿真结果证明:所提算法有效解决了非凸形数据集聚类问题。3)提出混合核模型的APMD算法。针对单核模型的APMD算法不适合混合分布的数据集聚类问题,提出了混合核模型的APMD算法。根据数据的流形结构信息建立多核模型,并利用流形边界自动调整核参数,通过多个核函数更好地拟合数据集结构。仿真结果证明:该算法能够解决多种流形混叠的数据集聚类问题,拓宽了近邻传播算法的应用范围。4)提出基于成对约束的半监督近邻传播算法。针对AP算法无法直接适用于有约束条件的聚类问题,提出了SAP-PC算法。在流形距离矩阵的基础上,利用成对约束的传播特性使约束在特征空间传播开来,并通过修改距离矩阵的方法将其展现,从而解决了约束条件对近邻传播算法应用的限制。此外,通过对成对约束进行开操作和闭操作选出闭包中心,用闭包中心代替约束对,从而解决了成对约束的违反问题。仿真结果证明:该算法可以有效提高聚类精度。
其他文献
通过问卷调查的方式了解并分析了中亚留学生的汉语词典使用策略。调查发现:大部分学生在汉语学习中未能有效利用词典使用策略,学生词典信息使用率偏低。对教学提出的建议:课
在重视传统、宣扬文化差异的全球环境下,作为民俗生活重要组成部分的民俗体育也开始了其复苏的历程。文章以中国和葡萄牙民俗体育的异同为主要研究对象,在我国选取了泪罗龙舟
创业板市场又称二板市场,是与主板市场(沪深证券交易所)相对应的概念,特指主板市场以外的、专门为新兴公司和科技型中小企业提供筹资渠道的新型资本市场。本文针对我国创业板
汽车行业在国民经济发展中有着举足轻重的地位。自2002年我国汽车行业进入爆发式增长以来,我国的汽车行业已逐渐成为我国经济发展的支柱行业之一。尽管在2008年,受经济危机影
文章针对武清行政高层建筑外檐斜柱悬挑架体设计及施工难点,对传统悬挑架体设计及施工进行了升级改进,满足外檐斜柱的施工要求。
<正>本刊讯2008年5月6日,中新天津生态城管委会召开新闻发布会,备受关注的生态城项目总体规划对外公布,生态城选址情况、发展目标、城市定位、经济职能、生态保护与生态修复
弦乐四重奏是古典主义时期最重要的室内乐形式,它以精致、抒情为本,善于营造出人与人之间亲切对话式的音乐氛围,受到人们的青睐。一个优秀的重奏团体,在面对风格、流派、样式
通过天津市西站建设工程第十二标某地铁站为实例,介绍地铁深基坑围护结构地下连续墙接缝处外侧采用三重管双高压旋喷桩为止水帷幕的施工工艺和质量保证措施,采取的技术、措施
于家堡站交通枢纽配套市政公用工程土建施工第三标段原设计在地连墙接缝外施作2根准800mm@600mm普通旋喷桩,深度40m。通过调查,普通工艺旋喷桩在沿海上软下硬土层条件下,成桩
随着工业化、城市化进程的加速,世界已经进入了所谓的“城市世纪”、“城市时代”,城市作为生产力空间的载体已日益成为区域经济的核心。一些国际性城市、大都市带、城市群或