谱聚类与维数约简算法及其应用

来源 :西安电子科技大学 | 被引量 : 5次 | 上传用户:mooyee6
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,在很多实际问题中,人们获取的数据具有很高的维数。数据的高维性使得计算机对数据的处理越来越复杂,导致“维数灾难”的现象发生,另外数据的高维性也掩盖了数据的内在特性,使人们不便于发现其中的规律。如何从高维数据中挖掘出有效的数据信息并发现数据的低维本质属性已经成为模式识别、应用数学、计算机视觉等领域的研究者所关注的共同问题。维数约简是人们处理这一问题的有效方法。另外,谱聚类也是数据挖掘的一个重要手段。本文对谱聚类和维数约简方法进行深入的研究,提出了一些新的有效的谱聚类和维数约简方法,并应用于图像分割和人脸识别中。本文的主要工作和创新成果如下:1.针对谱聚类算法对高斯核尺度参数敏感且该参数难以确定的缺陷,首先,利用核模糊C均值聚类算法进行粗聚类,得到隶属度向量构成的划分矩阵;其次,利用隶属度向量的内积,提出了一个无参数的核模糊相似度度量;最后,提出了一个基于核模糊相似度的谱聚类算法。实验结果表明,所提出的谱聚类算法不仅有效克服了算法对参数的敏感性,而且解决了高斯核尺度参数难以确定的问题。2.针对传统谱聚类算法中使用欧氏距离的相似性度量不适用于分布复杂数据及对参数敏感的问题,利用测地线距离,设计了一种基于流形距离的相似度度量,有效改善了算法对参数的敏感性及对分布复杂数据的实用性。在此基础上,针对谱映射空间K-均值聚类对初始聚类中心敏感、容易陷入局部最优的问题,提出了一个新的基于模拟退火的谱聚类方法,并将其应用于图像分割中。实验结果表明,所提出的新谱聚类算法不仅有效降低了算法对参数的敏感性,而且能有效避免算法陷入局部最优,改善了传统谱聚类算法的性能。3.当样本规模较大时,谱聚类方法复杂性过高、计算量大。针对此问题,提出基于超像素的谱聚类方法。该算法首先通过超像素的方法预处理,用超像素代替原来单个的像素;然后利用本文已提出的基于核模糊相似度度量构造加权无向图;最后采用谱聚类算法进行聚类,并将其应用于图像分割。所提方法大大降低了传统谱聚类算法的复杂度,减少了计算量。实验表明,相比较传统谱聚类方法,基于超像素的谱聚类方法获得了更好的分割效果。4.针对判别稀疏邻域保持嵌入(DSNPE)算法类间离散度构造复杂的问题,首先,通过保持平均脸的稀疏重构关系,设置了新的类间离散度;然后,通过同时最大化类间离散度和最小化类内紧凑度构造维数约简的目标函数;最后,提出了一种改进的维数约简算法,并将其应用于人脸识别。所提出算法不仅有效降低了DSNPE算法的复杂度,而且增强了类间判别力。人脸识别的仿真实验结果表明,相比较已有的其他算法,该算法具有较高的识别率。
其他文献
通过比较目前几种主要水下切割设备的性能,结合番禺30-1导管架安装浮筒拆除项目的特点,将高压水研磨料水下切割设备作为执行该项目的首选.文章介绍了CTS公司5000 PSI JETCUT
目的:探讨ARHI与Beclin1表达水平对甲状腺癌的分期和分化的影响。方法采用免疫组织化学检测72例甲状腺癌组织和癌旁组织以及40例正常组织中ARHI和Beclin1蛋白表达水平,并比较其
马克思劳动价值理论揭示了商品生产、商品交换和市场经济发展的最一般规律,对于我国深化经济改革,遵循经济发展规律有重要的现实指导意义。文章指出,以劳动价值理论指导"中国
<正>正是借助新闻知识的力量,社会公众得以形成对世界的价值感知,不断认识和适应世界的变化。网络社会的高速发展使得互联网内容中总是混杂着多重真相阐述和爆发式情绪表达,
本文建立离子色谱法同时测定环境空气中的二氧化硫和氮氧化物的方法。采用氢氧化钠和双氧水溶液作为吸收液,将空气中二氧化硫和氮氧化物转化为硝酸根和硫酸根后用离子色谱法测
低龄婴幼儿龋(Early childhood caries,ECC)发生、发展是由多种因素共同作用,多种微生物共同参与的复杂过程。因此、了解儿童口腔内致龋微生物的种类及其与龋病的相关关系,对
会计制度改革历来是我国会计行业的一件大事,它为规范我国会计主体的会计行为,真实、完整地反映财务状况,提高会计信息质量,为加快实现会计的国际接轨奠定良好基础。建国以来
联属网络营销行业虽然在国内才刚起步,但是在欧美国家已经非常成熟了,有相当多的人把它当作终生职业来从事,可见它的收入回报是非常高的。当然,网络营销是一项事业,它需要的
当前,较低的物流成本已成为企业获取竞争优势的主要影响因素,由于作业成本法能够分辨和去除物流过程中的无效成本,并对整个物流管理过程实施再造,该方法己成为现代物流成本核算和