论文部分内容阅读
随着科学技术的不断发展,数据越米越呈现高维化,从它们之间提取出有用的信息给我们带来了前所未有的挑战。因此,把高维数据通过降维方法映射投影到一个相对低维的空间,进而找到隐藏在其间的对我们有用的低维结构成为当前工作中一个重要内容。鉴于此,本文主要进行了以下的工作:
⑴简述了当前国内外关于降维的发展情况以及当前一些比较流行的降维方法。
⑵重点分析了非线性降维方法----局部线性嵌入,并结合已有的一些结论对该算法中参数的选择方法做了改进,特别是邻域k的选择上做了较为详细的探讨并得到了较为有效的解决办法。我们将改进前后局部线性嵌入降维引入医学数据和其他领域数据并加以比较,验证了改进后算法的优越性。
⑶分析比较了两种非线性降维方法:局部线性嵌入和等距映射,就他们对不同的邻域k和样本数N在运行效率上做了比较。
⑷基于局部线性嵌入方法对离群点、相离流形比较敏感,对原来的算法做了一些改进,即稳健局部线性嵌入,通过实验表明,改进后的算法在处理带有离群点、相离流形问题时结果得到明显改善。