论文部分内容阅读
多视点视频在3D电视、自由视点电视等领域展现了广阔的应用前景,并因其优于普通二维视频的临场感和交互性逐渐成为多媒体信息产业以及学术界的研究热点。但多视点视频由多台相邻摄像机从不同角度拍摄得到,数据量巨大,必须对其进行高效压缩来克服其难以传输和存储的技术难点。为了使多视点视频获得高效的压缩效率,2008年7月国际视频小组发布了多视点视频编码标准H.264/MVC作为H.264/AVC标准的高级档次,并发布了专门的参考模型JMVC(Joint Multiview Video Coding)。本论文以JMVC作为研究平台,针对多视点视频编码中占据整个计算复杂度50%以上的宏块模式选择部分进行了深入研究,主要研究内容和创新成果如下:1.回顾H.264/AVC视频编码器的基本原理及结构,并对基于H.264/AVC的多视点视频编码核心技术进行概括和总结;分析目前多种多视点视频编码预测结构并进行比较,选取其中编码性能优秀的AS_IPP结构作为本文研究采用的编码结构;对多视点视频编码参考模型JMVC的编码框架及模式选择准则进行研究,并将其作为本文后续针对多视点视频编码模式选择过程的研究基础;2.提出一种基于支持向量机的多视点视频快速宏块模式选择算法。通过分析并总结多视点视频数据中宏块模式的分布规律,针对模式选择阈值算法采用经验系数带来的鲁棒性低的问题,将支持向量机SVM方法引入多视点视频编码中,根据已编码参考视点编码信息与当前视点编码信息的强相关性原理,将模式选择问题转化为模式分类问题,利用人工智能学习机建立模式分类器模型,实现了低复杂度的多视点视频编码模式的快速选择,在保证原编码性能的前提下,显著提高多视点视频编码速度;3.提出一种基于深度信息的多视点视频快速模式选择算法。通过分析宏块模式与深度信息间的关系,将多视点视频序列中的宏块按照其对应深度值划分成远、近、中三个区域;针对复杂度最高的中距离区域,首先将全局视差矢量指向的参考视点对应块及其周边宏块采用率最高的模式作为候选模式,提前分离出可能采用大块模式的宏块,然后利用基于运动信息的深度平坦度动态阈值判定方法确定最终的宏块预测模式。实验结果表明该方法能够在显著降低多视点视频编码复杂度的同时,保证率失真性能不变。