【摘 要】
:
在很多实际的研究和应用中,数据往往以高维度的向量来表示,即所谓的“高维数据”,而这些高维数据通常可以由少量几个影响因素来表示,这就说明现实中的高维数据包含了大量的冗
论文部分内容阅读
在很多实际的研究和应用中,数据往往以高维度的向量来表示,即所谓的“高维数据”,而这些高维数据通常可以由少量几个影响因素来表示,这就说明现实中的高维数据包含了大量的冗余信息,同时也说明了用低维向量来反映高维数据本质特征信息是有意义的。这种用低维特征来表示高维数据的过程就是降维,即数据由高维约减到低维的过程,其在众多研究领域扮演着重要的角色。由于能够很好的挖掘出高维数据之间的潜在关系,许多基于流形学习的数据降维方法已经被研究并成功的应用于机器学习和模式识别中,如等距映射(Isomap)算法、局部线性嵌入(LLE)算法和局部保留投影(LPP)算法。其中,LPP是一种线性子空间降维方法,该方法能有效地处理已知训练集和新引入的数据点。但是,随着数据规模的快速增大,这些方法在存储消耗和计算复杂度上都存在着一定的限制。为了解决这些问题,本文在LPP算法的基础上提出了一种新的基于流形的线性降维方法,叫做基于锚点图的局部保留投影(AgLPP)算法。假定给定大量的数据点集合,AgLPP首先使用聚类算法产生少量的聚类中心作为虚拟的锚点。同时,文中也对少量的锚点能够保留原有数据集的骨架结构的特点做了实验验证,因而就可以把数据点之间的邻接权重矩阵以锚点作为中间过渡分为两步进行计算。最后,基于该邻接权值矩阵,就可以得到时间复杂度和存储消耗都是与数据集规模线性相关的AgLPP方法。另外,本文也提出了AgLPP在希尔伯特空间的核化形式KAgLPP,并进一步改进它,得到AgLPP基于锚点的稀疏表示SR AgLPP,使其与核函数带宽无关。这些方法能够在有限的时间和空间内进行大规模数据的降维。最后,通过对一些真实数据集进行实验验证,证实了所提算法的有效性和效率性。
其他文献
多媒体技术的不断发展,网络信道传输的速率也是越来越快,而在高速网络环境下,传统的基于包的数据传输通常会面临丢包或者误码等问题,因此在传输速率得到保障的前提下,准确率
随着数字化技术和网络应用技术的不断提高、以及多媒体通信业务的大幅增加,视频图像的数据也变得越来越大。但是由于信道容量有限,因此在对所得到的数据进行传输之前,必须采
宽带信号具有良好的距离分辨率、电磁兼容性、抗干扰性能、较高的穿透能力和低截获特性,因此自上世纪60年代以来,在雷达和通信等诸多领域得到了广泛的应用。人们在宽带信号产
单激励线阵三维成像合成孔径雷达(SAR:Synthetic Aperture Radar)系统是一种新体制SAR系统,它克服了传统二维成像SAR系统的阴影效应、几何畸变等缺点,可以对观测区域进行三维
路由协议的研究在Ad Hoc网络中有着非常重要的意义,多输入多输出技术(Multiple Input Multiple Output-MIMO)是当前研究的热点问题之一,其复用技术和分集技术在传输效率及可靠
毫米波介于厘米波与光学波段之间,具有光学的探测精度和微波的全天候工作特性。和微波相比,毫米波器件体积和重量更小,特别适合弹载武器的设计。毫米波的波束窄,制导精度高。
IPTV是通过宽带网络向家庭用户提供包括数字电视在内的多种交互式数字多媒体服务的一种崭新技术,已经陆续被世界各国的运营商所采用和大量部署。自从IPTV进入中国大陆以来,经
随着战时环境的日益严峻和现代雷达系统的不断发展,雷达目标识别得以产生,而雷达调制特征的识别分类技术为目标识别提供了新的途径。本文结合当前国内国际最新的雷达目标识别和
20世纪80年代后,随着大规模芯片集成技术和数字信号处理技术的高速发展,现代电子系统中,无线收发信机的应用越来越广泛。同时对无线收发信机的抗干扰能力和灵活性也提出了愈
合成孔径雷达(Synthetic Aperture Radar, SAR)图像舰船检测与分类是SAR图像解译技术关键问题之一,也是海洋遥感应用的重要研究方向,在渔业管理、海上交通管控、海洋资源开采