聚类分析及其在图像处理中的应用

被引量 : 62次 | 上传用户：youguxinzhu2009

【摘要】

：

聚类分析作为一种无监督学习方法,是机器学习领域重要研究方向之一。近年来,数据聚类正在蓬勃发展,聚类分析已成功应用于图像处理,文本挖掘,生物信息学等诸多领域。本文重点

【作者】

：

肖宇

【发表日期】

：

2012年01期

【关键词】

：

聚类分析相似性度量本质维数半监督聚类家族相似性图像分割图像去噪

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

聚类分析作为一种无监督学习方法,是机器学习领域重要研究方向之一。近年来,数据聚类正在蓬勃发展,聚类分析已成功应用于图像处理,文本挖掘,生物信息学等诸多领域。本文重点研究聚类分析中两个关键问题：相似性度量和聚类算法的设计及应用。聚类的目的是发现相似对象的集合,因此如何度量对象间的相似性是聚类分析中的一个关键问题。本文基于现有的高斯型相似度计算模型,提出了新的相似度计算模型,并针对数据特征对相似度的影响进行了讨论,将本质维数作为新的特征来改善相似性度量。在聚类算法设计及应用方面,针对不同的聚类问题,设计快速有效的聚类算法是十分必要的。本文分析了现有聚类算法的优缺点,提出了一种快速的基于相似度矩阵的聚类算法,并将其应用到图像分割中。考虑到现实中大多数图像受到了噪声干扰,为了降低噪声对图像分割和其他后续图像分析带来的影响,提出了一种基于稀疏表示的混合噪声去噪算法。本文的主要工作包括：(1)提出一种加权的自适应高斯型相似性度量方法。传统的高斯型相似度适用于同密度簇的聚类问题,而且对于数据中的野值点不够鲁棒。考虑到实际数据中野值点和不同密度簇的存在,提出了一种新的鲁棒的高斯型相似度计算方法。基于已有的自适应高斯型相似度度量,新的相似度根据数据点的邻域信息对每个数据点赋以权值,并通过降低野值点的权重来降低野值点与其他数据点的相似度。实验表明新的相似性度量能更好地反映类内和类间数据点的相似性关系,得到更加满意的聚类结果。(2)提出一种基于本质维数的相似性度量。相似性度量不仅依赖于相似度计算公式,还依赖于数据的特征。数据集中的每个类可以看作是一个子流形,通过定义反映流形拓扑结构的数据特征来对各个子流形进行划分。本质维数可以用于区分不同的流形结构,位于同一流形的数据点的本质维数应该保持致,具有不同本质维数的数据点通常也可以认为分布在不同的流形上。通过数据点的邻域信息来估计数据点的本质维数,将本质维数作为数据的新的特征,结合数据的原始特征来计算新的相似度。实验表明,基于新的相似度的聚类结果要优于单独使用本质维数或者原始特征的相似度得到的聚类结果。(3)对于具有复杂结构的数据集,只通过无监督的方法改变相似性度量很难达到满意的聚类结果。半监督聚类是利用有限的标签数据对全部数据的聚类过程进行指导,从而可以得到更好的聚类结果。本文提出一种基于近邻传播算法的半监督聚类算法。近邻传播算法是基于相似度矩阵的聚类算法,新算法根据约束对先验信息调整相似度矩阵,进而改善聚类结果。实验结果表明,通过加入少量先验约束对信息,半监督近邻传播算法较大程度地改善了无监督近邻传播算法的聚类结果。(4)基于VVittgenstein的家族相似性,提出了一种基于相似度矩阵的聚类算法。已有的基于相似度矩阵的聚类算法要么时间复杂度较高,要么需要调节的参数较多。新算法通过相似度矩阵构建邻接矩阵,然后在邻接矩阵中发现连通分支进而对数据进行划分。与常用的基于相似度矩阵的谱聚类算法相比,新算法无需计算特征向量,大大降低了时间消耗。而且,在给定相似度矩阵的基础上,新算法不需要设置任何参数。实验结果表明,新的聚类算法适用于图像分割问题。(5)为了降低噪声对图像分割和其他后续图像分析带来的影响,提出了一种基于稀疏表示的混合噪声去噪算法。该算法有效地结合了中值型滤波检测算法和字典学习算法,采用三阶段方法来优化本文提出的l1-l0去噪模型。新算法利用双重稀疏表示对图像进行二次重构,可以达到更好的去噪效果。实验结果表明新算法在去除脉冲噪声和高斯脉冲混合噪声上比现有算法有了明显改进。

其他文献

中小企业信贷风险研究

2008年以来,受金融危机影响,我国中小企业发展状况堪忧,困扰中小企业多年的融资难问题再次显现,为推动中小企业持续健康发展,国家有关部门出台多个扶持政策,银行业也将发展中

学位

中小企业风险管理应对措施

沉淀聚合中聚合物微球成球条件的探讨

近年来高分子微球材料作为高分子科学中一个充满活力且具有潜力的重要领域，得到了迅速地发展，引起了国内外学者越来越多的关注。聚合物微球是一种性能优良的新型功能材料，具有优

学位

沉淀聚合聚合物微球三维溶度参数

居住区室外空间环境的儿童安全性研究

居住区环境是城市环境的重要组成部分,安全的居住区环境是居民生活质量的基本保障。居住区中主要的使用者之一便是儿童,他们的成长过程少不了户外活动。然而,由于儿童自身的

学位

儿童使用安全居住区外部空间环境

淀粉基胶粘剂改性及应用的研究进展

阐述了近年来化学改性淀粉基胶粘剂的研究进展,包括氧化改性、酯化改性、接枝共聚改性、交联改性和纳米微粒复合改性等,并详细介绍了其在各领域的应用情况,最后对淀粉基胶粘

期刊

淀粉化学改性胶粘剂

任意带高斯正形投影平面直角坐标系统在武广客运专线勘测设计中的应用

由于定义国家大地坐标系的椭球面是一个凸起的不可展平的曲面,当采用高斯正形投影将曲面上的元素投影到平面上时,投影后的长度就会发生改变.当边长的两次归算投影改正不能满

期刊

投影变形任意带高斯正形投影客运专线线路勘测

抗菌不锈钢钨极氩弧焊工艺参数对接头力学性能的影响

抗菌不锈钢因为具有优异的抗菌性能和良好的加工性能,可广泛地应用于各个领域,如医疗设备、餐饮行业、海军装备等。文中采用的焊接方法是不填焊丝的钨极氩弧焊,以厚1 mm的304

期刊

抗菌不锈钢钨极氩弧焊正交试验力学性能

全日制专业学位硕士研究生教育质量保障机制研究

随着我国经济的快速发展,社会对高层次应用型专门人才的需求日益旺盛。当前的人才结构已无法满足社会的发展要求,培养具有实践性和职业性的人才队伍成为时代的需要,全日制专

学位

全日制专业学位教育质量质量保障机制

富血小板血浆复合珊瑚羟基磷灰石在即刻种植术中的应用

目的：利用富血小板血浆（platelet-rich plasma, PRP）复合珊瑚羟基磷灰石(corallinehydroxyapatite, CHA)，充填即刻种植术中种植体周围的骨缺损，并对成骨效果进行评价，为临床工作提

学位

富血小板血浆即刻种植珊瑚羟基磷灰石

自然垄断理论研究

在经济学理论中,“自然垄断”这个概念已经有了一百多年的历史。在这个概念产生以来的大部分时间内,传统的理论都把自然垄断产生的原因归结于规模经济性引起的平均成本递减。

学位

自然垄断成本次可加性功能分离Ramsey定价

青海野马泉地区晚古生代—早中生代岩浆作用与成矿研究

造山带成矿作用研究是当代国内外成矿学的研究前沿和热点。位于青海省东昆仑造山带西段的野马泉地区，晚古生代—早中生代岩浆作用与成矿作用发育，但区内以往对岩浆作用与成矿和

学位

岩石-构造组合俯冲同碰撞后碰撞岩浆分异矽卡岩矿床热液矿床斑岩矿床晚古生代—早中生代野马泉青海省

聚类分析及其在图像处理中的应用

与本文相关的学术论文