非线性数据流形的低维嵌入方法研究

来源 :华南理工大学 | 被引量 : 0次 | 上传用户：yuerenqiu

【摘要】

：

在对类似于专利战略分析系统这种复杂系统的研究中，一个非常棘手的问题就是高维数据的降维问题。决定现实世界演化的背景机制通常是非线性的，传统的线性降维方法(如主成分分析

【作者】

：

杨晋雯

【机构】

：

华南理工大学

【出处】

：

华南理工大学

【发表日期】

：

2007年期

【关键词】

：

非线性数据流形非线性数据流形高维数据映射高维数据映射局部线性嵌入局部线性嵌入降维降维测地距离测地距离文本分类文本分类LLE算法 LLE算法

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

在对类似于专利战略分析系统这种复杂系统的研究中，一个非常棘手的问题就是高维数据的降维问题。决定现实世界演化的背景机制通常是非线性的，传统的线性降维方法(如主成分分析法(PCA))在把高维数据映射到低维空间时，通常不能保留原高维数据的内在非线性结构和特征。因此非线性的方法(如局域线性嵌入(LLE)、等距映射(Isomap)等)应运而生，它们的优点是具有较少的参数需要设置，而且使用非迭代的方法去求解从而可以避免陷入局部极小。本文中我们使用局部线性嵌入(LLE)对高维数据进行降维。主要研究内容包括： (1)介绍了各种流形的高维数据降维方法以及各自的特点；并对经典的降维算法进行了比较。 (2)重点介绍了局部线性嵌入(LLE)算法原理，对LLE算法的邻域选择进行改进。LLE算法邻域选择采用欧氏距离，都采用全局一致的邻域参数，只适用于均匀分布的流形，无法处理现实中大量存在的非均匀分布流形，有不完善之处。新算法，用每个点的局部邻域估计此邻域内任意点之间的近似测地距离，然后根据近似测地距离与欧氏距离之间的关系动态确定该点的邻域参数，并以此参数构造新的局部邻域。该算法改进了LLE的邻域测度，更适合高维数据的降维。 (3)采用三组标准数据集，从可视化角度，对本文提出的新算法进行实验，分析实验结果。实验证明，新算法在可视化性能上明显提高。这表明优化邻域结构是一种重要的方向，未来我们可以设计更好的邻域优化算法，改造更多的基于邻域的降维算法。

其他文献

基于动态网络安全模型的内网信息监控系统的研究与应用

随着计算机网络在政治、经济、军事等领域的日益普及和广泛应用，越来越多的基于网络实现的信息服务系统，如电子商务、电子政务等迅速开展，逐渐形成以个人、企业与政府为主体的全

学位

动态网络安全模型内网信息监控系统网络安全内网安全异常检测

一种基于组织实体能力的软件过程Agent模型研究

自60年代出现软件危机以来，世界各国政府、计算机软件研究机构和组织在软件工程化方法、技术和工具的研究、开发和实践方面投入了大量的人力、物力和资金。人们认识到，要高效率

学位

组织实体

电快速脉冲对计算机通信接口电路的影响和防护

本文以本单位研发的有源电力滤波器(APF)的RS232通信线缆进行电快速脉冲群试验的时候，遇到RS232通信的接口芯片损坏的情况为切入点，进行电快速脉冲群对RS232通信影响和防护的研

学位

电快速脉冲计算机通信接口RS232通信防护手段

基于PC的网络性能测试系统研究

伴随着Internet的爆炸性增长，互联网越来越多地呈现出一些新的特征，主要体现在网络流量的指数型增长、业务种类的多样化以及网络架构的日益复杂化等方面。在日益庞大和复杂的网

学位

PC平台

基于经典LSB方法的彩色图像文件双重信息隐藏算法

以数字为媒介进行的数据传输，在当今极其重要，但在数字媒体数据传输过程中，可能会发生与所发送数据的安全相关的问题。水印技术被引入作为多媒体内容的知识产权(IPR)保护工具。

学位

彩色图像双重信息隐藏算法经典LSB方法数字指纹

混成式网络入侵检测与威胁评估的研究

伴随网络技术的普及和发展，网络安全问题日益严重。网络攻击事件频频发生，不仅造成巨大的经济损失，并且严重阻碍了网络技术的应用和发展，亟需建立有效的安全防护措施。为了保

学位

入侵检测混成式入侵检测误用检测威胁评估网络攻击网络安全

导弹协同数据链链路协议研究

多元化协同作战使武器协同成为必需。对于导弹攻击，单枚导弹已经无法充分发挥其作战效能，多导弹间的协同作战变得越来越重要。多枚导弹组成的编队，通过采用有效的协同策略，可极大

学位

导弹协同作战数据链技术链路协议

面向业务服务的应用系统开发方法研究

信息技术已经成为现代组织赖以生存和发展的基石，现代组织机构(如企业、政府机关、教育等)都越来越依赖于IT支撑下的各种应用系统，与此同时，他们也对应用系统建设的敏捷性、灵活

学位

面向业务服务应用系统开发Web服务SOM4EUD模型最终用户

基于FPGA的星载计算机容错技术研究

空间辐射作为航天器故障的主要来源，一直以来备受人们的关注，星载计算机的容错技术也成为航天器设计的关键技术之一。随着半导体制造工艺的发展，电子器件的物理尺寸不断减小，以往

学位

星载计算机容错技术单粒子多位翻转数据交错高可靠性

平均奖赏强化学习研究

强化学习是一种以环境反馈作为输入的，特殊的、适应环境的机器学习方法．agent在与环境交互中通过“试—错”的方式对不同状态下各动作的期望反馈进行学习，以最优化长期收益。按

学位

强化学习平均奖赏值学习算法算法语言

非线性数据流形的低维嵌入方法研究

与本文相关的学术论文