论文部分内容阅读
动态纹理是图像序列的重要信息和特征,它是图像序列中一类空间上重复、时间上变化并且满足某种平稳特性的视觉模式,例如火焰和飘扬的旗帜等.作为一类重要的自然视频信号来源,它通常会产生极大量的高维数据,因此,迫切需要提出有效的分析和处理方法.由于动态纹理具有复杂的运动特性,使得其研究更具挑战性.张量是向量和矩阵在组织结构上由低维向高维扩展所得到的一般形式,它是高维数据的自然表示方式,能够保持数据的内在结构.张量分解是矩阵奇异值分解的高阶扩展,被认为是高维数据处理最具潜力的方法之一.最近十几年来,张量方法的研究兴趣已经扩展到信号和图像处理等领域,为基于矩阵的传统高维数据分析和处理方法开拓了新的思路.本文研究张量分解及其在动态纹理中的应用,主要取得如下成果.1.提出一个保持高维数据内在结构的张量动态纹理模型,并提出一个相应的参数估计算法.与近十几年内动态纹理领域开创性的研究成果――线性动态纹理模型相比,提出的模型能够从不同模式,例如空间、颜色和时间,对动态纹理的特性进行灵活刻画,从而能够更充分的挖掘动态纹理的内在特征和性质.2.将提出的张量动态纹理模型用于动态纹理合成这一实际应用,进行大量对比实验和分析.实验结果表明,与线性动态纹理模型相比,我们的模型能够在模型大小较小的情况下,显著提高合成动态纹理的视觉效果,平均PSNR能够提高2dB至7dB.3.提出高维数据紧凑表示的概念,是对稀疏表示概念的一步推进.考虑到保持数据的内在结构,提出一个张量多次低秩逼近算法,用于得到一个紧凑表示.我们的算法能够灵活实现不同低秩逼近,且能够在计算复杂度和逼近精度之间取舍.4.将提出的张量紧凑表示方法用于动态纹理的紧凑表示和编码,由于能够更好的保持数据的内在结构,使得编码性能得到很大提高.与H.264/AVC相比,我们的方法能够显著提高编码视频的质量,平均PSNR能够提高0.41dB至8.76dB,与此同时,平均码率减小比例能够达到1.04%至77.81%.特别是对一类规则动态纹理视频,我们的方法能够以极低码率,得到视觉效果非常好的编码视频.实验结果还表明,对于高阶张量,使用迭代秩1分解,很难获得一个好的紧凑表示.5.人群图像序列是一类特殊的动态纹理,针对人群密度估计这一应用,研究基于高阶张量分析的方法.首先,提出一种基于高阶奇异值分解构造张量主子空间标准正交基的方法.然后,提出两个基于张量主子空间特征的人群密度估计方法.提出的方法能够保持人群数据的自然结构,从而能够对人群特征进行有效刻画,其类别表征能力很强.实验结果表明,我们的方法明显优于基于灰度共生矩阵和基于小波变换的方法,其正确率能够达到96.83%,提高12%左右,且误分类图像基本集中在邻近类别.