非线性数据流形的低维嵌入方法研究

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:yuerenqiu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在对类似于专利战略分析系统这种复杂系统的研究中,一个非常棘手的问题就是高维数据的降维问题。决定现实世界演化的背景机制通常是非线性的,传统的线性降维方法(如主成分分析法(PCA))在把高维数据映射到低维空间时,通常不能保留原高维数据的内在非线性结构和特征。因此非线性的方法(如局域线性嵌入(LLE)、等距映射(Isomap)等)应运而生,它们的优点是具有较少的参数需要设置,而且使用非迭代的方法去求解从而可以避免陷入局部极小。本文中我们使用局部线性嵌入(LLE)对高维数据进行降维。主要研究内容包括: (1)介绍了各种流形的高维数据降维方法以及各自的特点;并对经典的降维算法进行了比较。 (2)重点介绍了局部线性嵌入(LLE)算法原理,对LLE算法的邻域选择进行改进。LLE算法邻域选择采用欧氏距离,都采用全局一致的邻域参数,只适用于均匀分布的流形,无法处理现实中大量存在的非均匀分布流形,有不完善之处。新算法,用每个点的局部邻域估计此邻域内任意点之间的近似测地距离,然后根据近似测地距离与欧氏距离之间的关系动态确定该点的邻域参数,并以此参数构造新的局部邻域。该算法改进了LLE的邻域测度,更适合高维数据的降维。 (3)采用三组标准数据集,从可视化角度,对本文提出的新算法进行实验,分析实验结果。 实验证明,新算法在可视化性能上明显提高。这表明优化邻域结构是一种重要的方向,未来我们可以设计更好的邻域优化算法,改造更多的基于邻域的降维算法。
其他文献
随着计算机网络在政治、经济、军事等领域的日益普及和广泛应用,越来越多的基于网络实现的信息服务系统,如电子商务、电子政务等迅速开展,逐渐形成以个人、企业与政府为主体的全
自60年代出现软件危机以来,世界各国政府、计算机软件研究机构和组织在软件工程化方法、技术和工具的研究、开发和实践方面投入了大量的人力、物力和资金。人们认识到,要高效率
学位
本文以本单位研发的有源电力滤波器(APF)的RS232通信线缆进行电快速脉冲群试验的时候,遇到RS232通信的接口芯片损坏的情况为切入点,进行电快速脉冲群对RS232通信影响和防护的研
伴随着Internet的爆炸性增长,互联网越来越多地呈现出一些新的特征,主要体现在网络流量的指数型增长、业务种类的多样化以及网络架构的日益复杂化等方面。在日益庞大和复杂的网
学位
以数字为媒介进行的数据传输,在当今极其重要,但在数字媒体数据传输过程中,可能会发生与所发送数据的安全相关的问题。水印技术被引入作为多媒体内容的知识产权(IPR)保护工具。
伴随网络技术的普及和发展,网络安全问题日益严重。网络攻击事件频频发生,不仅造成巨大的经济损失,并且严重阻碍了网络技术的应用和发展,亟需建立有效的安全防护措施。 为了保
多元化协同作战使武器协同成为必需。对于导弹攻击,单枚导弹已经无法充分发挥其作战效能,多导弹间的协同作战变得越来越重要。多枚导弹组成的编队,通过采用有效的协同策略,可极大
信息技术已经成为现代组织赖以生存和发展的基石,现代组织机构(如企业、政府机关、教育等)都越来越依赖于IT支撑下的各种应用系统,与此同时,他们也对应用系统建设的敏捷性、灵活
空间辐射作为航天器故障的主要来源,一直以来备受人们的关注,星载计算机的容错技术也成为航天器设计的关键技术之一。随着半导体制造工艺的发展,电子器件的物理尺寸不断减小,以往
强化学习是一种以环境反馈作为输入的,特殊的、适应环境的机器学习方法.agent在与环境交互中通过“试—错”的方式对不同状态下各动作的期望反馈进行学习,以最优化长期收益。按