360度全景视频编码技术研究

来源 :宁波大学 | 被引量 : 0次 | 上传用户:mario2
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着多媒体传输技术的快速发展及播放设备性能的不断提升,用户对观看视频的质量和观看方式有了更高的要求。虚拟现实(Virtual Reality,VR)技术或360度全景视频技术凭借其独特的观影体验给用户带来了强烈的临场感而广受欢迎。虽然360度全景视频给用户以沉浸式体验而广受欢迎,但随之而来的超高分辨率与巨大数据量,导致其面临传输带宽高、具有极高的编码复杂度等问题。因此,本学位论文基于高效视频编码标准(High Efficiency Video Coding,HEVC),为解决360度全景视频编码传输过程中的数据量大、编码复杂度高两个核心问题展开研究。本文关于360度全景视频的具体研究内容如下:(1)针对360度全景视频传输过程中数据量大的问题,提出了一种基于感兴趣区域的360度全景视频编码算法。利用360度视频画面中感兴趣区域较为单一的特点,使用编码残差提取感兴趣区域,通过为感兴趣区域分配更多的码率,非感兴趣区域分配较低的码率,最终实现在整体码率降低的情况下感兴趣区域仍能够保持较好主观质量的目的。实验结果表明,该算法与HEVC原始参考软件相比,相同码率条件下视频质量平均提高0.15d B,相同客观质量条件下码率最高节省4.98%,平均节省2.46%,同时感兴趣区域画面质量达到有效保持。(2)为解决360度全景视频编码复杂度高的问题,提出了基于运动属性和纹理特征的360度全景视频帧间快速编码算法。首先利用360度全景视频画面特点,提出一种运动属性判别方法,以判定待编码单元(Coding Unit,CU)是静止块或运动块,计算当前最大编码单元(Largest Coding Unit,LCU)的边缘特征以建立纹理四叉树用来预测划分深度和预测模式。然后,在当前LCU运动属性已知的情况下,分别利用空域相邻已编码CU的划分深度、运动属性对当前LCU划分深度范围进行预测。利用当前CU的运动和纹理特征、周围已编码块的预测模式来预测当前编码CU所属的预测单元(Prediction Unit,PU)的预测模式类别。实验结果表明,所提算法与HEVC原始参考软件相比,实现BD-Rate只增加1.74%的条件下编码时间平均节省72.27%。达到了有效降低360度全景视频帧间编码复杂度的目的。(3)面对基于投影面的传输方法需要极高的传输带宽这一问题,提出了基于显著区域的视口分层编码方法,基本层传输低质量的360度全景视频画面,视口层基于HEVC中的Tile块进行划分,显著区域分配较大码率,而非显著区域分配较少码率。与基于投影面的对比方法相比,所提方法在码流文件存储、视频画面质量两方面与基于投影面性能相当,然而,基于视口的传输方案传输冗余度很小,与基于投影面的传输方法相比其传输带宽更低
其他文献
社会治理的目标追求是建设和谐社会,核心是人,重点在基层。城市是推动社会现代化建设发展的重要力量,城市基层与群众利益直接相关,利益需求的多样性使其成为城市社会治理最关键最复杂的地方。新时代,国内社会主要矛盾产生新的变化,国际环境形势依旧复杂,为实现中华民族伟大复兴中国梦,稳步推进新型城镇化建设,首先要建立良好的城市基层治理秩序,解决好城市治理问题的主要矛盾。因此,加强城市基层社会治理创新是构建和谐社
社会科学技术的发展以及人类对健康的需求促进了医学诊疗事业的发展,近年来,西医诊疗设备在临床及科研中的优秀表现带动了传统中医与科学技术的联合应用,对中医诊疗设备的研
供应链金融以核心企业雄厚的公司实力及供应链链上各企业之间真实的贸易关系为依托,为链条上下游的中小企业提供担保,在解决了小微企业生产运营中资金短缺的问题的同时,中小企业用以核心企业为债务人的应收账款进行出质向商业银行申请金融贷款也成为融资的主要方式以应收账款质押的方式进行企业融资给我国应收质押制度带来了较大的考验。不同于其他担保物权的设立及实现,由于应收账款属于金钱债权,不具有任何实体,质权的担保功