论文部分内容阅读
随着多媒体通信技术的发展,在个人多媒体设备(PDA、智能手机等)上接收和播放高清晰数字视频的服务越来越受到人们的青睐。由于受到网络带宽与接收终端显示材料的限制,原始的高分辨率视频编码码流往往需要被转换为适合接收端显示的低分辨率编码后进行传输。作为新一代的国际视频编码标准,H.264编码标准在图像质量与编码效率上都有了很大的提升,因此得到越来越广泛的应用。对H.264码流进行降低空间分辨率的视频转码技术成为了近年来人们研究的热门话题之一。本论文主要研究对H.264编码码流的空间降尺度转码中的一些关键技术,包括宏块重编码的模式选择问题,运动矢量重估计的方法等。其中,宏块的重编码模式选择又分为帧内与帧间两类进行讨论。在帧间图像的预测中,由于使用完全搜索的运动估计方法会占用相对较多的时间,如何使用输入码流中的运动矢量信息来获取转码码流的运动矢量值,成为了转码过程中的一个关键问题。另外,选用不同的运动矢量合成及运动矢量精细化方法,在提高预测准确性的同时也有可能造成的码流长度增加,因此对转码质量与码率的控制也是需要注意的一个方面。通过对传统降尺度转码算法的研究,本文提出了一种改进的算法,采用了新的运动矢量测度因子,并通过自适应阈值的分类方法对不同视频序列选择合适的重编码模式,对不同的视频序列都能做出较准确的判断。对于运动剧烈的视频序列,本算法比传统运动矢量合成方法提高了约1dB的PSNR,与DIM方法在相同比特率情况下提高了0.1~0.7dB的图像质量;对于平缓序列,在保持较高转码图像质量的同时,与DIM方法相比降低了30%~60%转码后码流大小。论文的最后一部分简要介绍了作者在硕士期间所做的另外一部分工作内容,即AVS熵解码部分的实现以及在DSP平台上的优化工作。通过算法级和指令级的优化,提高了DSP的并行处理能力,使熵解码部分的解码速度提高了3倍以上,为最终达到实时解码奠定了基础。