论文部分内容阅读
近年来,图像和视频编码都取得了长足进步,在压缩效率方面,国际标准JPEG2000、H.264/AVC、MPEG-4以及国内的AVS标准是前一代标准的两倍以上。但是目前的视频编码标准都是以率失真作为评价标准,比如时域和空域上的统计冗余,而对视频最权威的评判者——人,考虑得很少。从主观视觉评价的引入来看,在未来的视频编码系统中,将会更多地考虑基于人眼视觉质量。因此,本文从人眼视觉的角度出发对图像中的纹理区域进行了研究,提出了基于视觉信息的纹理编码框架。它主要由纹理分析器把人眼不敏感的纹理区域分割出来,并利用视觉质量评价标准选择最优的纹理合成方法进行处理,而其余的区域仍然按照传统的编码方式进行编码。 在本文提出的编码框架中首先需要从视频图像中提取出人眼不敏感的纹理区域,采用两种分割方法,第一种是基于块聚类的纹理分割算法,利用MPEG-7中提出的SCC描述子作为相似度准则,并结合EMD距离把纹理区域分割出来。另一种是基于K-均值聚类的纹理分割方法,利用纹理和颜色作为特征矢量,为纹理合成打下基础。 在对基于全局运动估计的放射模型以及基于碎片缝合的纹理合成方法的研究和分析之上,改进了基于碎片缝合的纹理合成技术,在一定程度上提高了合成的质量。并在此基础上提出了基于视觉信息的纹理编码框架,在编码端先判断当前处理的宏块是否是纹理块,若是,则利用基于仿射模型和改进的基于碎片缝合的纹理合成分别进行处理,并利用JND模型来判决出最优的方法,在解码端利用相应的边角辅助信息以及参考帧图像对纹理块进行合成;若不是,就采用传统的编解码方式进行处理。实验结果表明,这个纹理编码框架在不同类型的纹理图像中,都能取得不错的视觉效果。 另外,本文还提出了一种基于Inpainting的纹理合成方法,利用碎片先对纹理区域进行填充,去掉碎片间相互重叠区域中的像素,那么碎片之间就出现了缝隙,利用Inpainting技术对这些缝隙进行合成,实验表明,能达到较好的视觉效果。