论文部分内容阅读
随着多媒体传输技术的快速发展及播放设备性能的不断提升,用户对观看视频的质量和观看方式有了更高的要求。虚拟现实(Virtual Reality,VR)技术或360度全景视频技术凭借其独特的观影体验给用户带来了强烈的临场感而广受欢迎。虽然360度全景视频给用户以沉浸式体验而广受欢迎,但随之而来的超高分辨率与巨大数据量,导致其面临传输带宽高、具有极高的编码复杂度等问题。因此,本学位论文基于高效视频编码标准(High Efficiency Video Coding,HEVC),为解决360度全景视频编码传输过程中的数据量大、编码复杂度高两个核心问题展开研究。本文关于360度全景视频的具体研究内容如下:(1)针对360度全景视频传输过程中数据量大的问题,提出了一种基于感兴趣区域的360度全景视频编码算法。利用360度视频画面中感兴趣区域较为单一的特点,使用编码残差提取感兴趣区域,通过为感兴趣区域分配更多的码率,非感兴趣区域分配较低的码率,最终实现在整体码率降低的情况下感兴趣区域仍能够保持较好主观质量的目的。实验结果表明,该算法与HEVC原始参考软件相比,相同码率条件下视频质量平均提高0.15d B,相同客观质量条件下码率最高节省4.98%,平均节省2.46%,同时感兴趣区域画面质量达到有效保持。(2)为解决360度全景视频编码复杂度高的问题,提出了基于运动属性和纹理特征的360度全景视频帧间快速编码算法。首先利用360度全景视频画面特点,提出一种运动属性判别方法,以判定待编码单元(Coding Unit,CU)是静止块或运动块,计算当前最大编码单元(Largest Coding Unit,LCU)的边缘特征以建立纹理四叉树用来预测划分深度和预测模式。然后,在当前LCU运动属性已知的情况下,分别利用空域相邻已编码CU的划分深度、运动属性对当前LCU划分深度范围进行预测。利用当前CU的运动和纹理特征、周围已编码块的预测模式来预测当前编码CU所属的预测单元(Prediction Unit,PU)的预测模式类别。实验结果表明,所提算法与HEVC原始参考软件相比,实现BD-Rate只增加1.74%的条件下编码时间平均节省72.27%。达到了有效降低360度全景视频帧间编码复杂度的目的。(3)面对基于投影面的传输方法需要极高的传输带宽这一问题,提出了基于显著区域的视口分层编码方法,基本层传输低质量的360度全景视频画面,视口层基于HEVC中的Tile块进行划分,显著区域分配较大码率,而非显著区域分配较少码率。与基于投影面的对比方法相比,所提方法在码流文件存储、视频画面质量两方面与基于投影面性能相当,然而,基于视口的传输方案传输冗余度很小,与基于投影面的传输方法相比其传输带宽更低