论文部分内容阅读
三维视频(Three Dimensional,3D)编码是新一代多媒体视频系统的研究热点,多视点视频编码(Multi-view Video Coding, MVC)是3D编码的核心发展方向之一。MVC与传统的单通道视频技术相比,多视点视频编码至少要处理两倍的数据量,需要极大的存储空间。由于人眼视频的最终接受者,因此在MVC中怎么结合视人眼视觉系统(Human Visual System, HVS)的感知特性的研究具有深远的意义。本文基于HVS的感知特性研究MVC,在保证人眼感知质量的前提下,达到了低复杂度和高压缩效率的编码目的。(1)恰可察觉失真模型(Just Noticeable Distortion, JND)模型能够准确描述人眼视觉特性,本文利用人眼视觉的立体特性建立了多视点视频的JND模型。提出的模型包含时空域JND及深度JND。利用新的JND模型,提出一种非对称立体视频编码算法,首先使用新的JND模型自适应调节MVC的编码量化参数(Quantization Parameter,QP)。实验结果表明,与标准的方法相比,本文算法在保持相同的视觉主观质量下,对于各种不同属性的测试序列平均节约码率24.18%~36.24%。(2)针对MVC采用可变尺寸模式选择技术提高编码效率的同时带来巨大编码复杂度,本文提出基于感知的MVC宏块模式选择快速算法。利用JND的概念,通过统计实验获得MVC宏块的最优编码模式的分布比例和JND的联系,确定提前结束宏块最优编码模式搜索过程的阈值,进一步减少MVC的方向搜索和参考帧搜索的次数,提高MVC的编码速度。实验结果表明不同运动属性的测试序列,提出的算法在率失真性能变化可以忽略的情况下,节约编码时间70.81%~79.84%。(3)针对MVC采用多参考帧预测技术带来的巨大编码复杂度,提出基于双目恰可察觉失真(Binocular Just Noticeable Difference, BJND)的多视点视频多参考帧快速选择算法,通过统计实验分析获取最优参考帧与BJND之间的联系,优化MVC最优参考帧选择过程。实验结果表明,提出的快速算法比多视点视频编码校验模型平均节约76%的编码时间,同时保持了编码的率失真性能。