基于3D-HEVC的低复杂度编码方法研究

来源 :宁波大学 | 被引量 : 0次 | 上传用户:wangkanli
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
传统的视频编码标准H.264已经难以满足用户对视频清晰度的要求。2010年初,ITU-T和ISO/IEC联合成立的视频编码联合协作组(Joint Collaborative Team on Video Coding,JCT-VC)制定了新一代视频编码标准H.265,制定的目标是相比于H.264,视频压缩效率提高一倍。由于高效视频编码(High Efficiency Video Coding,HEVC)采用更大尺寸块等一系列新的编码技术,导致复杂度成倍的增加。此后,3D视频联合协作组在HEVC的基础上,进行了3D扩展,除了运用单视点HEVC的编码技术外,还增加了视点间的估计。因此,去除HEVC和3D-HEVC的时空域冗余、视点间冗余以及感知冗余成为研究的热点。  (1)针对HEVC帧内编码复杂度高的特点,本文提出了一种基于绝对变换误差和(Sum of Absolute Transformed Difference,SATD)和最有可能模式(Most Probable Mode,MPM)的HEVC快速帧内模式选择算法来去除空间冗余。本文在HM9.0算法模式粗选决策(Rough Mode Decision,RMD)过程后采用自适应阈值进行筛选,同时根据MPM的SATD和MPM中是否含有DC、Planar模式来决定率失真优化(Rate Distortion Optimization,RDO)过程的候选预测模式列表,通过减少RDO的预测模式个数来提高编码速度。实验结果表明,本文算法较HM9.0算法,帧内编码时间节省34.73%,同等码率下的峰值信噪比(Bj-ntegaard Delta Peak Signal-to-Noise Rate,BDPSNR)仅降低0.045dB,同等客观质量下的码率(Bj-ntegaard Delta Bit Rate,BDBR)仅仅增加0.90%。  (2)针对HEVC帧间预测高复杂度的特点,本文首先通过建立时空域人眼恰可察觉失真(Just Noticeable Difference,JND)和最佳预测模式的统计关系来指导帧间预测模式的快速选择。然后,利用时空域的相关性来预测当前最大编码单元(Largest CU,LCU)的遍历深度范围(Depth Range,DR);最后,融合这两种算法以进一步降低视频编码的计算复杂度。研究结果表明,所提出方法在低延时和随机访问两种编码结构下,降低了40%以上的计算复杂度,BDPSNR仅分别降低0.058dB和0.037dB,BDBR仅分别增加1.71%和1.06%;  (3)为降低多视点视频编码的计算复杂度,去除视频的感知冗余。本文提出一种基于人眼双目恰可察觉失真(Binocular Just Noticeable Difference,BJND)模型和3D-Sobel的多视点视频快速编码方法。首先,利用3D-Sobel算子将右视点图像分成显著区域和非显著区域;然后,根据视频编码中的失真量化(Distortion Quantization,D~Q)模型估计显著区域的误差平方和,利用时空域以及视点间的相关性线性加权估计非显著区域的误差平方和;同时,计算由BJND值求取的误差平方和;最后,结合BJND值得到的误差平方和以及相应区域估计得到的误差平方和作为当前编码单元的决策阈值,根据决策阈值提前终止右视点帧间预测模式的选择,从而降低右视点的编码复杂度。实验结果表明,所提出方法在分层B帧(Hierarchical B Pictures,HBP)编码结构下,较HTM10.0算法降低了右视点53%的计算复杂度,在相同主观质量梯度幅度相似度偏差(Gradient Magnitude Similarity Deviation,GMSD)下的码率降低0.4%,在相同PSNR下的码率仅增加0.9%。
其他文献
多媒体服务中,音视频同步是影响用户感知体验的一个核心问题,其同步的好坏直接关系到在线视频点播、远程视频教学等多媒体服务质量的高低。以信息隐藏思想为基础的基于 H.26X的
当今社会,随着信息技术和计算机网络的迅猛发展,使得文本、图像、视频、音频等数字产品也日益丰富。数字作品的易于无损复制、分发的特性,使得出于各种目的的盗版行为日益猖
培训优秀的科级党员领导干部、乡镇一般干部、村民委主任等,为我国输送优秀的基层人才,推动我国基层建设发展,是我校成立以来就承担的责任.而党十九大的召开,“不忘初心,牢记
语音转换是指改变源说话人的语音个性特征,使之具备目标说话人的语音个性特征,从而使源说话人的语音听起来像目标说话人的语音的一种处理技术。语音转换的研究是在语音识别和
随着多媒体技术和互联网的发展,数字音频逐渐成为人们获得信息的主要途径之一,丰富人们的生活和学习。但是不法分子为达到其不可告人的目的,往往会对数字音频内容和音质进行篡改
从企业思想政治宣传工作的目的性、针对性、内容性三个方面,探讨如何做好企业思想政治宣传工作,为企业思想政治宣传工作的开展提供参考资料.
双向工频通信系统(Two Way Automatic Communication System, TWACS)是一种基于电力配电网络的通信系统,其在上世纪九十年代出现于美国。TWACS系统通过在电压过零时刻在电压、电流波形上产生畸变来传递信息,其能够通过简单、经济的手段实现跨变压器台区的长距离传输,是一种非常适用于低速传输的信道传输模式。其具有成本低廉、传输距离远、抗干扰能力强、维护方便等优点。目
随着三维视频的流行和多媒体技术的发展,立体视频图像作为三维视频的主要表现形式,其安全受到了威胁。针对立体图像的完整性和真实性,利用立体图像特征,设计立体图像的自恢复认证
常规电能利用率低下的现象广泛地存在于人们的日常生活中,有必要将可利用的电能进行收集和回馈。逆变电源作为一种电能变换装置,在电力系统中发挥着重要的作用。它将直流逆变为交流,进而实现电能的再生反馈。电梯电能回馈系统就是采用逆变电源将变频器直流母线上的泵升电压进行逆变与能量反馈,从而达到节能环保、稳定工作环境的目的。然而逆变回馈需要在一定的条件下才能进行,逆变电源必须具有输出高质量电压波形的能力。逆变技
随着无线局域网(WLAN)的发展,越来越多的“热点”(AP)接入网络,但由于无线频率资源的有限性,设备之间的干扰越来越严重,极大的影响了网络的数据吞吐量。为了解决这一问题,802