论文部分内容阅读
图像是人类日常生活中获取信息的主要来源。随着图像获取技术以及设备的不断更新换代,人们获取的图像数据量急剧增长,这给图像信息的存储、传输带来了巨大的挑战。因此寻求高效的图像视频压缩方法,是当下十分迫切的一项课题。现实生活里,大量的图像获取条件是在相同或者类似的场景,它们基本以图像集的形式存在。集合内图像间存在一定的信息冗余,有效利用这些冗余信息,将会提高图像集压缩效率,进而有效节省存储空间。因此,在基于传统单幅图像压缩技术的基础上如何充分利用图像集合冗余信息,是图像集压缩的主要研究方向之一。传统的单幅图像压缩技术大多是通过变换获取信号的紧致表示,然后通过量化、熵编码等步骤完成图像编码过程。例如在应用最广泛的JPEG标准中,信号变换使用的是DCT基底。使用固定的基底对信号进行变换无法自适应信号本身内容特性,另外,一些复杂信号也不能被灵活高效的表达,无法获取更加紧致的表示。本文针对图像集的压缩问题,将稀疏表示理论与传统图像压缩技术相结合,提出基于稀疏字典的图像集压缩方法,主要研究内容包括以下两个方面:第一,提出了指数分布稀疏字典模型,并在传统图像编码框架下,建立了基于该字典模型的图像集压缩方案。稀疏字典相对于DCT等固定基底而言,能够通过样本训练来自适应图像集自身内容特性,可以更加灵活高效地表达多种信号。本文提出的基于指数分布的稀疏表示模型,在传统稀疏表示模型的基础上加入新的约束,要求信号在进行稀疏分解时,系数不仅具有稀疏特性,还能够呈现一定的指数分布下降规律,从而具有一定的可压缩特性。实验结果表明,在低码率下,基于指数分布模型稀疏字典的图像集压缩方案相较于传统的JPEG方法在主观质量上和客观质量上都有一定的提升。第二,基于回归最小二乘稀疏字典建立了内容自适应图像集压缩方案。相较于传统的稀疏字典(例如K-SVD字典),回归最小二乘字典在迭代学习过程中通过不断更新样本和引入遗忘因子的方法来降低字典对样本的依赖性,使得字典训练结果不依赖于初始化字典,具有离线字典的稳定特性,因此减少了字典传输的代价。本文使用回归最小二乘字典算法,利用一个固定的外部图像数据库,通过分类采集训练数据的方法实现自适应学习图像集内容的目的。字典分类使得非零稀疏系数分布更加紧致,能量更加集中,压缩效率得以进一步提高。另外,解码端利用图像自身非局部相似特征和外部图像数据库相似特征,指导图像集解码重建过程,以此提高重建质量。实验结果表明本方案有效提高了图像集压缩性能。