论文部分内容阅读
H.264视频编码标准中了采用分数象素运动估计和多模式运动估计算法,与传统的MPEG-4、H.263+相比较,其编码效率和性能都显著提高。然而,由于在运动估计中引入了亚象素插值和估计与模式决策等,这使得其硬件实现增加了复杂度和系统延时。
在研究中,本文首先通过软件仿真,分析了分数象素插值方法,分数象素搜索范围,分数象素精度,多模式选择等多个方面对于运动估计性能的影响,进而确定了硬件系统所采用的关键技术。
其次,本文提出了一种适用于H.264标准中亚像素运动估计算法的硬件实现架构。架构中采用一维处理单元PE阵列(1×16)来实现整数像素运动估计算法中最佳匹配块的搜索,再采用一维处理单元PE阵列(1×3)得到亚像素最佳匹配块的运动向量。亚像素运动估计架构采用两个并行的PE阵列,可以在相同的时钟周期内得到亚像素的最佳匹配。
在此基础上,本文提出一种适用于H.264标准中多模式运动估计的二级模式决策算法及其硬件实现架构。新的决策算法采用了二级模式决策,降低了决策的深度,减少了系统延时。硬件架构中采用改进的PE单元和模式决策算法,先计算4×4子块的SAD,通过比较相邻子块的运动向量是否相同来判定最终搜索模式。多模式自适应运动估计架构采用二级模式决策算法,不但能降低残差数据量,而且还可以有效的减少运动向量和模式参数所占用的比特流。
通过以上优化可以看到,本文所设计的两套系统都能够有效的降低残差数据量,提高运动估计器的编码效率和性能,并且还有结构简单,易于硬件实现等优点,具有良好的可拓展性,方便用于将来的一些视频标准中。