基于局部线性嵌入的高维数据降维研究

来源 :中南大学 | 被引量 : 15次 | 上传用户:ylali001
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着科学技术的不断发展,数据越米越呈现高维化,从它们之间提取出有用的信息给我们带来了前所未有的挑战。因此,把高维数据通过降维方法映射投影到一个相对低维的空间,进而找到隐藏在其间的对我们有用的低维结构成为当前工作中一个重要内容。鉴于此,本文主要进行了以下的工作:   ⑴简述了当前国内外关于降维的发展情况以及当前一些比较流行的降维方法。   ⑵重点分析了非线性降维方法----局部线性嵌入,并结合已有的一些结论对该算法中参数的选择方法做了改进,特别是邻域k的选择上做了较为详细的探讨并得到了较为有效的解决办法。我们将改进前后局部线性嵌入降维引入医学数据和其他领域数据并加以比较,验证了改进后算法的优越性。   ⑶分析比较了两种非线性降维方法:局部线性嵌入和等距映射,就他们对不同的邻域k和样本数N在运行效率上做了比较。   ⑷基于局部线性嵌入方法对离群点、相离流形比较敏感,对原来的算法做了一些改进,即稳健局部线性嵌入,通过实验表明,改进后的算法在处理带有离群点、相离流形问题时结果得到明显改善。
其他文献
本文综合利用第一章中给出的临界点理论,Morse理论及流不变集理论等非线性分析方法研究了几类非线性边值问题解的存在性,获得了一系列新的可解性和多重性结果。   第二章,
Hopfπ-余代数是Hopf代数的一个重要推广,其中π为-离散群.本文给出了不同于文献[8]中的π-smash余积的概念并研究了其相关性质,将twisted smash余积和L-R smash余积推广到Hopf
学位
学位
学位
本文主要研究了二元极值分布的定义、分布函数、吸引场以及谱测度的估计量.第一章介绍了极值统计发展的历史和经典的极值理论;第二章介绍了二元极值分布函数的性质,研究了如何
设{Xn}n≥0为-Markov链,转移概率为pij=αj-(i-1)+1{j≥(i-1)+},(A)j,i≥0.本文主要讨论这类排队模型常返Markov链的首回速度,通过对首回时的α阶矩有限性的讨论给出零常返、