论文部分内容阅读
HEVC(High Efficiency Video Coding)视频编码标准面向高清、超高清视频应用,采用更加高效的视频编码工具,与H.264编码标准相比较,HEVC对高质量视频编码的压缩率提高了约一倍,同时编码器的计算复杂度增加了数倍,其中运动估计计算复杂度最高。因此,研究运动估计算法实现,加速算法执行具有很重要的意义。 可重构计算硬件既具有通用处理器的灵活性又具有专用集成电路的高性能、低功耗的优点,适合用来加速计算密集型任务。HEVC运动估计算法是典型的计算密集型任务,非常适合在可重构计算硬件上实现。 本文研究HEVC运动估计全搜索算法在可重构计算硬件上的映射方法,着重解决算法映射面临的访存冲突问题和数据搬运时间优化问题。首先提出采用 PU(Prediction Unit)间复用 SAD(Sum of Absolute Difference)策略的基础架构;其次针对最小尺寸PU SAD生成模块的映射,提出两种减少存储器访问的映射方式:算法映射结构方式与基本计算单元并行方式;再次探讨减少存储器访问的加法树模块映射方法,并提出多级 PU处理架构;最后研究当前块数据、参考块数据在可重构计算硬件的存储系统中的缓存与复用策略,降低对存储器的访问,减少数据搬运时间。 本文采用提出的映射方法,在可重构计算硬件电子系统级模型上实现HEVC运动估计全搜索算法,支持8×8搜索区间,并支持从8×8到64×64全部对称PU划分方式,获得8.71的加速比,与编译器自动编译相比,该实现可以得到更好的加速效果,分析结果表明,本文提出的方法可以充分的利用可重构计算硬件的并行计算能力,较好的加速HEVC运动估计算法执行。为了满足格式为1920×1080@30fps高清视频实时编码要求,本文根据性能测试结果进行计算资源扩展分析,在此基础上,提出可重构计算硬件计算资源扩展方案。