论文部分内容阅读
帧内编码是新一代高效视频编码(High Efficiency Video Coding-HEVC)标准H.265中的核心部分之一。其引入了更先进的预测技术,可大幅度地提升视频编码的编码效率,但是同时编码过程也变得极为复杂,给实时处理带来巨大挑战。新兴的图形处理器(GPUs)提供了强大的多层次并行处理能力,为帧内编码算法的实时实现提供了硬件平台。因此,如何充分挖掘帧内编码算法的并行性,并结合GPU的特点进行并行优化,对于促进H.265视频编码的实际应用,具有重要意义。在分析帧内编码中数据级与线程级并行性的基础上,提出了基于GPU平台的H.265帧内编码并行优化方案。为了充分挖掘帧内编码的并行性、加速帧内编码过程,分别提出了层次化的并行性对应关系模型和基于OpenCL(Open Computing Language)的多级并行优化策略。首先,分析帧内编码的详细流程,根据多个预测方向所需要的参考像素位置,确定其五个方向的数据依赖。然后对应于多个单元层次的编码流程,建立了层次化的并行性对应关系模型;其次,利用GPU高并行性的特点,设计相应级别的并行优化策略,再结合OpenCL编程特点,对ND-range(N-Dimensional Range)划分等部分的实现细节进行优化,并采用影响视频质量的码率估计分析法,提出了基于OpenCL的多级并行策略。综合以上的并行性对应关系模型和多级并行策略,完成了基于GPU平台的H.265帧内编码并行优化方案。实验结果表明,在应用了GPU并行优化方案以后,帧内编码关键部分的速度相对于HM(HEVC Test Model)最高提升0.89倍,相应的PSNR(Peak Signal to Noise Ratio)质量损失在0.75dB以内。而当允许更大的PSNR质量损失时(1.21dB),速度可以最高提升1.42倍。总而言之,H.265帧内编码的GPU并行优化方案,可以在保证视频质量损失在用户可接受范围内的同时,有效的提升编码速度。