论文部分内容阅读
近年来,随着计算机和互联网技术的快速发展,人们可以很容易地获取海量的数据。这些数据往往是高维的、复杂的,并且包含了大量的噪声和冗余信息。因此,如何实现高维数据的低维表示并探索其本质结构,是十分具有挑战性的问题。低秩表示(LRR)算法作为模式识别、机器学习、计算机视觉等领域的重点研究课题,能够有效地发现高维数据的低维子空间结构和数据中噪声的结构特点,目前已被广泛应用于子空间聚类、半监督学习、目标跟踪等多种应用场景。
低秩表示算法的基本思想是将数据矩阵表示成在字典矩阵下的线性组合,并通过求解秩最小化问题使得该线性组合的系数矩阵是最低秩的。其中,约束低秩表示算法通过对系数矩阵设计不同的约束项,可以进一步揭示数据的结构信息,是目前的研究重点。现有的约束低秩表示算法从其定义、发展过程以及具体的应用方向上考虑,可分为基本约束LRR、稀疏约束LRR和流形约束LRR。但无论哪一类方法,由于不同应用场景的数据复杂多变、低秩结构信息挖掘不准确、其他结构信息利用不全面以及不确定数据噪声的干扰,其揭示数据本质结构的能力有待改善,在各种量化性能评价指标上的表现都需要进一步提升。本文正是基于这一目标,在对国内外一些具有代表性的约束LRR方法深入研究的基础上,提出了几种改进的约束LRR方法。论文的研究成果主要体现在以下几个方面:
(1)提出一种基于加权Schatten-p范数和Lq范数的鲁棒低秩表示(RLRR)算法,并应用于子空间聚类问题。为了更好地估计秩函数和描述不同的噪声,RLRR算法在LRR算法的基础上引入加权Schatten-p范数和Lq范数以实现性能提升。一方面,将LRR算法中的核范数推广到Schatten-p范数并对系数矩阵的奇异值分配不同的权重,从而更准确地估计秩函数。另一方面,使用Lq范数代替LRR算法中的L2,1范数来描述噪声,进一步提升算法鲁棒性。最后,采用非精确的增广拉格朗日乘子方法(IALM)求解所提出的目标函数。该方法与几种具有代表性的子空间聚类算法相比,鲁棒性更好,聚类指标得到提升,在受光照变化、高斯噪声、块状遮挡干扰下的Extend Yale B数据集上的平均聚类错误率均低于SPN算法,分别低出2.42%、5.10%和4.30%。
(2)提出一种基于L2,p范数的快速低秩表示(FLRR)算法,并应用于子空间聚类问题。针对LRR算法在求解过程中需要计算多次奇异值分解(SVD),计算效率低的缺陷,提出一种改进的算法,旨在保证算法准确率和鲁棒性的同时,提高算法的计算效率。具体来讲,分别使用Schatten-p范数和L2,p范数代替LRR算法中的核范数和L2,1范数,从而使模型更具一般性和鲁棒性。然后对数据矩阵进行QR分解,将原问题转化为小尺度的L2,p范数最小化问题。在该问题的求解过程中不需要计算SVD,从而降低了计算成本。在人工数据集、公共图像数据集和运动分割数据集上的实验结果表明,本文提出的FLRR算法的聚类错误率和算法运行时间指标优于其它几种具有代表性的对比方法,特别是在公共图像数据集上,FLRR算法的运行时间比LRR算法快2~4倍。
(3)提出一种基于平滑秩估计和加权稀疏约束的半监督低秩表示(SSLRR)算法,并应用于半监督学习问题。SSLRR算法分别对非负低秩稀疏图(NNLRS)算法的低秩项和稀疏项进行改进,从而准确地描述数据的全局子空间结构和局部线性结构。在构建目标函数时,使用对数函数代替核范数平滑地估计秩函数,同时利用形状交互信息和有标签样本的类别信息构造加权稀疏约束正则项。然后通过带有自适应惩罚的线性交替方向法(LADMAP)求解目标函数并重构数据的图结构,最后利用基于局部和全局一致性(LGC)的半监督分类框架完成学习任务。当有标签样本的数量为10%时,SSLRR算法在ORL、Extend Yale B、PIE和USPS数据集上的分类准确率分别达到82.94%、93.50%、83.97%和92.99%,超过12种具有代表性的基于低秩表示和经典图的半监督学习算法,验证了算法的有效性。
(4)提出一种融合矩阵低秩表示和稀疏流形约束的目标跟踪(LRSMT)算法。为了挖掘基于粒子滤波的目标跟踪算法中粒子样本问的全局和局部结构信息,LRSMT算法将粒子样本用字典模板表示,并对表示系数加以低秩、稀疏和流形约束。具体来讲,对系数矩阵的奇异值进行弹性网正则化来捕获粒子样本间的低秩结构,并构造一个拉普拉斯图来捕获粒子样本间的流形结构。同时,利用时间一致性自适应的裁剪和选择候选粒子,并动态地更新字典模板以进一步提高算法性能。最后,在粒子滤波框架下利用LADMAP方法对算法进行优化。在OTB目标跟踪数据集的50个具有挑战性的视频序列上同14种有代表性的跟踪方法进行定性和定量比较,LRSMT算法的AUC值和准确率指标分别达到53.8%和71.7%,均高于其他比较方法。表明所提算法的跟踪性能更好。
综上所述,本文的第一项研究成果是针对约束LRR算法中基本的低秩约束情况,通过准确地挖掘数据的低秩结构信息和处理不同的噪声,提高了子空间聚类算法的鲁棒性;第二项研究成果是在保证算法鲁棒性的同时,进一步提高了算法的计算效率;第三项研究成果是探讨了算法的低秩和稀疏约束,通过同时利用数据的全局子空间结构信息和局部线性结构信息,提高了半监督学习算法的性能;第四项研究成果是将基于低秩、稀疏和流形约束的LRR算法应用于目标跟踪领域,提高了传统算法的跟踪效果。从模型的复杂程度考虑,四项研究成果的模型从简单到复杂,呈现出一种递进关系。从模型的实用角度考虑,前三项研究成果偏重于算法研究,第四项研究成果偏重于实际应用,实现从理论到应用的过渡。
低秩表示算法的基本思想是将数据矩阵表示成在字典矩阵下的线性组合,并通过求解秩最小化问题使得该线性组合的系数矩阵是最低秩的。其中,约束低秩表示算法通过对系数矩阵设计不同的约束项,可以进一步揭示数据的结构信息,是目前的研究重点。现有的约束低秩表示算法从其定义、发展过程以及具体的应用方向上考虑,可分为基本约束LRR、稀疏约束LRR和流形约束LRR。但无论哪一类方法,由于不同应用场景的数据复杂多变、低秩结构信息挖掘不准确、其他结构信息利用不全面以及不确定数据噪声的干扰,其揭示数据本质结构的能力有待改善,在各种量化性能评价指标上的表现都需要进一步提升。本文正是基于这一目标,在对国内外一些具有代表性的约束LRR方法深入研究的基础上,提出了几种改进的约束LRR方法。论文的研究成果主要体现在以下几个方面:
(1)提出一种基于加权Schatten-p范数和Lq范数的鲁棒低秩表示(RLRR)算法,并应用于子空间聚类问题。为了更好地估计秩函数和描述不同的噪声,RLRR算法在LRR算法的基础上引入加权Schatten-p范数和Lq范数以实现性能提升。一方面,将LRR算法中的核范数推广到Schatten-p范数并对系数矩阵的奇异值分配不同的权重,从而更准确地估计秩函数。另一方面,使用Lq范数代替LRR算法中的L2,1范数来描述噪声,进一步提升算法鲁棒性。最后,采用非精确的增广拉格朗日乘子方法(IALM)求解所提出的目标函数。该方法与几种具有代表性的子空间聚类算法相比,鲁棒性更好,聚类指标得到提升,在受光照变化、高斯噪声、块状遮挡干扰下的Extend Yale B数据集上的平均聚类错误率均低于SPN算法,分别低出2.42%、5.10%和4.30%。
(2)提出一种基于L2,p范数的快速低秩表示(FLRR)算法,并应用于子空间聚类问题。针对LRR算法在求解过程中需要计算多次奇异值分解(SVD),计算效率低的缺陷,提出一种改进的算法,旨在保证算法准确率和鲁棒性的同时,提高算法的计算效率。具体来讲,分别使用Schatten-p范数和L2,p范数代替LRR算法中的核范数和L2,1范数,从而使模型更具一般性和鲁棒性。然后对数据矩阵进行QR分解,将原问题转化为小尺度的L2,p范数最小化问题。在该问题的求解过程中不需要计算SVD,从而降低了计算成本。在人工数据集、公共图像数据集和运动分割数据集上的实验结果表明,本文提出的FLRR算法的聚类错误率和算法运行时间指标优于其它几种具有代表性的对比方法,特别是在公共图像数据集上,FLRR算法的运行时间比LRR算法快2~4倍。
(3)提出一种基于平滑秩估计和加权稀疏约束的半监督低秩表示(SSLRR)算法,并应用于半监督学习问题。SSLRR算法分别对非负低秩稀疏图(NNLRS)算法的低秩项和稀疏项进行改进,从而准确地描述数据的全局子空间结构和局部线性结构。在构建目标函数时,使用对数函数代替核范数平滑地估计秩函数,同时利用形状交互信息和有标签样本的类别信息构造加权稀疏约束正则项。然后通过带有自适应惩罚的线性交替方向法(LADMAP)求解目标函数并重构数据的图结构,最后利用基于局部和全局一致性(LGC)的半监督分类框架完成学习任务。当有标签样本的数量为10%时,SSLRR算法在ORL、Extend Yale B、PIE和USPS数据集上的分类准确率分别达到82.94%、93.50%、83.97%和92.99%,超过12种具有代表性的基于低秩表示和经典图的半监督学习算法,验证了算法的有效性。
(4)提出一种融合矩阵低秩表示和稀疏流形约束的目标跟踪(LRSMT)算法。为了挖掘基于粒子滤波的目标跟踪算法中粒子样本问的全局和局部结构信息,LRSMT算法将粒子样本用字典模板表示,并对表示系数加以低秩、稀疏和流形约束。具体来讲,对系数矩阵的奇异值进行弹性网正则化来捕获粒子样本间的低秩结构,并构造一个拉普拉斯图来捕获粒子样本间的流形结构。同时,利用时间一致性自适应的裁剪和选择候选粒子,并动态地更新字典模板以进一步提高算法性能。最后,在粒子滤波框架下利用LADMAP方法对算法进行优化。在OTB目标跟踪数据集的50个具有挑战性的视频序列上同14种有代表性的跟踪方法进行定性和定量比较,LRSMT算法的AUC值和准确率指标分别达到53.8%和71.7%,均高于其他比较方法。表明所提算法的跟踪性能更好。
综上所述,本文的第一项研究成果是针对约束LRR算法中基本的低秩约束情况,通过准确地挖掘数据的低秩结构信息和处理不同的噪声,提高了子空间聚类算法的鲁棒性;第二项研究成果是在保证算法鲁棒性的同时,进一步提高了算法的计算效率;第三项研究成果是探讨了算法的低秩和稀疏约束,通过同时利用数据的全局子空间结构信息和局部线性结构信息,提高了半监督学习算法的性能;第四项研究成果是将基于低秩、稀疏和流形约束的LRR算法应用于目标跟踪领域,提高了传统算法的跟踪效果。从模型的复杂程度考虑,四项研究成果的模型从简单到复杂,呈现出一种递进关系。从模型的实用角度考虑,前三项研究成果偏重于算法研究,第四项研究成果偏重于实际应用,实现从理论到应用的过渡。