高效视频编码中帧内编码的GPU并行优化

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:sqqmyquanqs
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
帧内编码是新一代高效视频编码(High Efficiency Video Coding-HEVC)标准H.265中的核心部分之一。其引入了更先进的预测技术,可大幅度地提升视频编码的编码效率,但是同时编码过程也变得极为复杂,给实时处理带来巨大挑战。新兴的图形处理器(GPUs)提供了强大的多层次并行处理能力,为帧内编码算法的实时实现提供了硬件平台。因此,如何充分挖掘帧内编码算法的并行性,并结合GPU的特点进行并行优化,对于促进H.265视频编码的实际应用,具有重要意义。在分析帧内编码中数据级与线程级并行性的基础上,提出了基于GPU平台的H.265帧内编码并行优化方案。为了充分挖掘帧内编码的并行性、加速帧内编码过程,分别提出了层次化的并行性对应关系模型和基于OpenCL(Open Computing Language)的多级并行优化策略。首先,分析帧内编码的详细流程,根据多个预测方向所需要的参考像素位置,确定其五个方向的数据依赖。然后对应于多个单元层次的编码流程,建立了层次化的并行性对应关系模型;其次,利用GPU高并行性的特点,设计相应级别的并行优化策略,再结合OpenCL编程特点,对ND-range(N-Dimensional Range)划分等部分的实现细节进行优化,并采用影响视频质量的码率估计分析法,提出了基于OpenCL的多级并行策略。综合以上的并行性对应关系模型和多级并行策略,完成了基于GPU平台的H.265帧内编码并行优化方案。实验结果表明,在应用了GPU并行优化方案以后,帧内编码关键部分的速度相对于HM(HEVC Test Model)最高提升0.89倍,相应的PSNR(Peak Signal to Noise Ratio)质量损失在0.75dB以内。而当允许更大的PSNR质量损失时(1.21dB),速度可以最高提升1.42倍。总而言之,H.265帧内编码的GPU并行优化方案,可以在保证视频质量损失在用户可接受范围内的同时,有效的提升编码速度。
其他文献
目前,我们已经进入了以网络计算为中心的时代,人们迫切需要在任何时候、任何地点访问所需要数据,移动计算为之提供了手段。它是无线通信、网络技术与移动计算设备相结合的产物,是
钱塘中间件平台软件(JTang Middleware Series)是一个大型集成化中间件平台软件,为了提供良好的可扩展性,有必要设计与实现一套高效的集群服务。P2P技术中每个节点处于平等地位
学位
在异构数据的信息集成和语义检索以及本体映射中,解决语义匹配一直以来都是一个难题。本体能够明确表示一定领域的概念和概念之间的关系,利用这一特点,本文进行基于本体的语义匹
当前社交网络、生物网络等构成的图的规模正迅速增长。许多应用场景都需要完整的图信息,但介于普通机器已无能力单独存储整张图,通过对完整的图进行计算从而进行信息提取变得
热传导反问题是指通过研究对象内部或者边界的温度相关信息,确定边界/初始条件、导热系数、内热源强度等宗量的未知部分,是一个涉及到传热学、物理、数学、计算机、实验技术等学
Web Services是自包含、自描述、可通过网络进行访问的模块化的应用程序组件。它们可以被程序调用来完成一个特定的任务。Web Services使网络由面向文档转变为面向服务,从而大
学位
无线移动ad hoc网络(MANET,Mobile Ad hoc Network)是一种不依赖于固定网络结构、可以快速展开、网络中节点处于完全平等地位的网络,具有拓扑多变性、能量有限、带宽有限、自组
图像是现代信息社会中最基本的信息。数字图像处理技术是一种具有巨大经济效益和社会效益的实用技术,应用领域十分广泛。本课题的研究以隧道施工开发为背景,在隧道挖掘过程中通