论文部分内容阅读
随着人们对视频清晰度的要求越来越高,H.264/AVC视频压缩技术已经无法满足新的需求,为此ITU与MPEGE国际化组织专门研究制订新的视频编码标准HEVC(High Efficiency Video Coding)。HEVC依然沿用MC/DCT混合编码框架,同时为达到提高视频编码质量和编码效率的目标,HEVC从各个方面提出了技术改进。对H.264中的HD高档次级别,在编码质量相同的条件下,HEVC的压缩率提高了一倍。然而,压缩率显著提高的代价是计算复杂度急剧上升,从而带来了较大的编码时延,这阻碍了HEVC的应用和推广。只有提高编码速度才能满足应用的需求,因此,对HEVC的编码过程进行优化十分必要。本文从并行计算的角度对HEVC编码优化进行了研究。首先对HEVC视频编码框架进行分析,重点研究耗时占比较大的帧间编码模块,分析出帧间运动估计部分有大量复杂且过程重复的运算,由此对运动估计采用并行技术进行优化。并行优化是在CUDA环境里,利用GPU的并行计算架构的特点对原有模块进行并行改造。论文利用CUDA对HEVC中的整像素运动搜索、分像素插值和分像素运动搜索进行多线程优化,同时对测试编码器HM10.0中的运动估计提出了基于GPU并行优化的算法改进。在整像素运动估计中提出基于CUDA的并行运动矢量预测技术,该算法为运动搜索提供搜索起始点,在并行模板下提高了搜索的精确度。在分像素运动搜索中提出了简化搜索方案,提高了搜索效率。论文最后还提出了利用CPU多线程结合GPU多线程对测试编码器HM进行加速的方案,CPU端利用两个线程均衡编码方案,主线程执行主要编码工作,次线程负责调用CUDA函数和数据传输,该方案实现了在GPU执行操作的期间CPU同时执行编码任务,通过异步并行将运动估计的时间隐藏。实验表明,通过CUDA加速运动估计的各模块可以有效减少编码时间,整像素运动搜索加速比可以达到9倍,分像素运动搜索加速比可以达到23倍;分像素插值中亮度和色度的插值滤波加速比分别可以达到58倍和53倍。对于整个帧间编码回路,CUDA并行优化的加速比可达到1.6左右。并且,随着视频序列分辨率的提高,其加速效果更为明显。在相同压缩性能的情况下,并行方法能够大大提高压缩速度。