论文部分内容阅读
互联网时代,海量高维数据的涌现成为模式识别面临的巨大挑战,降维技术是处理高维数据,克服“维数灾难”的重要方法。近年来,尽管降维技术取得了一定程度的发展,由于高维数据的数据量大以及维数高,使得对数据的特征提取工作具有很大的困难,同时也拥有广阔的发展前景。本文研究了数据降维技术的几种经典方法,并在这些经典方法的启发下,对某些算法过程以及处理速度进行改进优化,提出了几种新的降维方法。本文的主要工作如下:1.回顾几种经典降维方法,并用一个一般化的图嵌入框架将它们统一描述。针对传统图嵌入框架下图构建方法具有计算缓慢的缺陷,我们结合稀疏编码理论的优点,并利用最小二乘方法,提出了一种基于正则化最小二乘法的图嵌入框架RLSGE,改进了图构建模式。该方法在保持传统图嵌入框架所具备的鲁棒性强等特点的同时,提高了降维处理速度。在RLSGE框架下,提出了一种基于正则化最小二乘的鉴别映射特征提取方法(RLSDP)。该方法在继承SPP的稀疏特性的基础上,优化了图构建速度,并且将原有无监督学习模式变为有监督学习模式,很好地利用了样本数据的标签信息,提高了分类准确率。2.在行为识别领域的特征提取方法研究中,结合视频序列的时域特点,提出了一种基于偏最小二乘的降维描述子动作分类方法:对传统HOG特征进行扩展,构建了空间-时间梯度方向,将时空信息融合利用,并用偏最小二乘法进行快速降维,利用了特征的类标签信息。在标准数据集上验证了该方法的有效性。