基于流形距离的聚类算法研究及其应用

被引量 : 0次 | 上传用户:zzzzzzvb
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
聚类分析是一种数据缩减技术,即基于数据特征的相似性将数据聚集成不同的类,是数据挖掘中一种非常有效的工具,得到了人们广泛的关注。本论文主要从聚类算法中的相似性度量和初始化敏感问题入手,采用新的基于流形距离的相似性度量替代传统的基于欧氏距离的相似性度量,通过全局的方法选择初始聚类中心,提出两种方案解决引入流形距离带来的计算量增大问题,并将这两种聚类算法应用到聚类分析和图像分割当中。本论文取得的主要成果如下:在本文中,我们提出了一种流形聚类算法,称为基于流形距离的全局原型聚类算法(Global Prototypical Clustering Algorithm based-on Manifold Distance,GPMC)。在新算法中,聚类中心选自数据集本身,在选择每个聚类的聚类中心时,依据一种新的基于流形距离的相似性度量,该度量计算的是数据点间沿着流形的测地线距离。在确定初始聚类中心时,GPMC从优化的角度出发,使用全局的方法进行选择。对于部分人工数据集和UCI数据集的实验表明,从聚类性能和鲁棒性的角度来看,新算法在处理复杂、非凸的数据聚类问题时有效可行。在第三章中,本文提出了一种用于复杂分布数据的二阶段聚类算法(Two-Phase Clustering,TPC),TPC包含两个阶段:首先,将数据划分为若干个球形分布的子类,每一子类用其聚类中心代表该类内的所有数据点;然后,利用可以处理复杂分布数据的流形进化聚类算法(Manifold Evolutionary Clustering Algorithm,MEC)对第一阶段得到的聚类中心进行类别划分;最后,综合两次聚类结果整理得到最终聚类结果。该算法基于改进的K均值算法和MEC算法。在进化聚类算法的基础上加入了流形距离,使算法能胜任复杂数据聚类。同时,新算法降低了引入流形距离所带来的计算量。我们在部分人工数据集和UCI数据集上测试了二阶段聚类算法,实验结果可以说明,无论对于简单或复杂、凸或非凸的数据,TPC都表现出良好的聚类性能。在第四章中,我们以基于流形距离的全局原型聚类算法为基础,结合形态学方法,提出一种用于图像分割的新方法,称为基于分水岭与流形距离的全局原型聚类图像分割算法(Global Prototypical Clustering Image Segmentation Algorithm based-on Watershed and Manifold Distance,WGPMC)。新算法首先使用分水岭算法的改进算法——内外标记的分水岭算法,对图像进行粗分割,将图像分为许多小区域;接下来,以小区域为单位,取得其图像特征,使用GPMC进行二次分割;对应两次分割的结果,得到带分割图像的最终分割结果。我们将新算法用于多种图像分割任务,包括SAR图像和自然图像,实验表明新算法可以成功地用于多种图像分割,具有良好的图像分割性能。
其他文献
目的:通过生物电阻抗检测仪测量出维持性血液透析患者的脂肪组织及非脂肪组织含量,研究二者水平与营养不良状况、血红蛋白水平、微炎症状态、内毒素水平、尿毒症毒素水平以及
社会资本是一种结构性资源。孔子学院借助社会资本能够有效地应对资源配置过程中面临的挑战。社会资本通过约束合作、投资回报、心理认同这三条路径发挥资源配置的作用。这三
以简支桁架为例,将机动法推广到桁架内力影响线的求解中.此方法以虚功原理为理论依据,借助相应机动连续梁的荷载位移图并结合桁架任意两结点之间的影响线为直线原则,将其修改
精品课程建设是目前提升民族体育舞蹈教育教学效果的必然举措,传统的建设手段已经难以满足课程建设中的实际需要,新思路是当前的唯一选择。文章从此出发,首先对民族体育舞蹈
背景随着人口老龄化和急性心肌梗死后生存率上升,慢性心力衰竭(CHF)患者数量迅速增加,因心力衰竭(HF)失代偿而住院的人数相应增加。部分患者住院原因是因为新发的急性心力衰
中文摘要过失以危险方法危害公共安全罪是《中华人民共和国刑法》第一百一十五条第二款的规定,但法律中对该罪名的叙述较少而且有关过失以危险方法危害公共安全罪的理论和研
随着城镇化速度的加快,人口密集、交通拥挤的问题日益突出;然而现有的城镇街道又难于拓宽,交通沿线拆迁征地困难重重,因此高架路逐渐成为各地的首选,这对于疏散交通密度、提高
目的:1.通过收集我院股骨头坏死患者31例,采集病例症状、专科体征与实验室检查结果等资料,建立数据库进行数据管理。2.根据症候资料将病例分为气滞血瘀型、寒湿痹阻型、肝肾亏
目的:通过观察雾化吸入利多卡因对支气管哮喘模型大鼠肺组织中水通道蛋白5 (Aquaporin 5, AQP5)、热休克蛋白70 (Heat shock protein 70, HSP70)、核因子kB (Nuclear factor-k
医药生物行业是关系到国计民生的重要行业,近年来,医药、生物制品上市公司越来越为投资者所关注。医药生物行业上市公司若想显示核心竞争力,提升社会形象,增强其在资本市场的