H.264全搜索块匹配整数运动估计VLSI设计

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:ypengw
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
H.264是由ITU-T VCEG和ISO/IEC MPEG组成的联合视频工作组JVT(Joint Video Team)于2003年3月正式提出的最新一代视频压缩标准。该标准支持从低带宽、高误码率的无线移动视频通信到高码率、低延迟的视频广播及在线流媒体等多种应用,日益受到业界的关注。为了实现更高的编码,H.264标准采用了很多新的编码技术,特别是运动估计中采用了1/4像素精度、变块尺寸、多参考帧等新技术,因此在保证相同解码图像质量下,H.264比MPEG-2和H.263的编码性能至少提高了一倍以上。与此同时,H.264编码器的计算复杂度也大大增加,需要消耗大量的时间和系统资源。运动估计占编码器总的编码时间的60%~80%;其中整数运动估计又占了整个运动估计的大部分计算负载。为了达到实时性,完成巨大的计算任务,运动估计需要用硬件加速——进行高并行度VLSI设计。本文在分析研究了各种整数运动估计算法和结构的基础上,结合高性能VLSI设计实现的特点,提出了一种改进的16×16脉动阵列及流水线相结合的全搜索可变块尺寸匹配的整数运动估计结构,完成了其VLSI设计。该设计充分考虑数据重用,参考帧数据分布式存储到片上RAM中,当前帧数据块在PE(Processing Element)阵列中横向和纵向循环移动达到重用,同时搜索区数据在片上RAM之间不需要传递,因而搜索帧和当前帧数据都只需要输入一次,大大减少了数据存储带宽,详细的数据调度使得数据流很规则流畅,硬件计算效率达到100%;运动估计搜索范围为16×16,每个时钟周期完成一个搜索点的匹配计算,同时中间SAD(Sum of Absolute Difference)计算结果重用,通过小数据块的组合实现大数据块的计算,完成变块运动估计。用Matlab和Verilog完成了该设计的算法和RTL(Register Transform Level)设计和验证;采用HJTC 0.18μm 1P6M CMOS工艺,用Synopsys逻辑综合和验证工具完成了门级设计与验证,时钟工作频率125MHz,等效逻辑门208K,SRAM为30K Bytes,用Cadence SoC Encounter进行了物理设计,芯片面积为4mm×4mm。实验表明本设计能实时完成SHDTV(1920×1080,60f/s)视频序列的整数运动估计,满足H.264应用需求。
其他文献
随着对光学手性药物需求量的增加,手性分离技术迅速发展。获取光学纯手性药物的方法很多,但大多数方法存在拆分过程繁琐、成本高等缺点。近年来,手性拆分凝胶因其分离过程简
创新对于一个国家的重要性是不容忽视的,国家的发展,"中国梦"的实现需要具创新能力的人才。而创新型人才又不是一蹴而就的,它需要教育的创新。随着现代科学技术的发展,在信息经
美国“无线电之王”公司生产了一种新的“银冠”KN62,也许可以称得上是一种最先进的测距器,它是板装式,根据大规模集成电路原理,有200路波道系统,因而使它具有新 The Unite
期刊
激光诱导击穿光谱(Laser-Induced Breakdown Spectroscopy,简称LIBS)是一种新的多元素同时检测方法,其工作原理是利用高能脉冲激光束聚焦后入射到样品表面,产生激光等离子体,
警务危机状态下公安机关及其人民警察往往被赋予较大的自由裁量权,使其可以做出应急反应,化解危机,但如果对此不加以适当的调整,也可能对公民权利造成不当损害。其在危机状态
期刊
随着改革开放的深入推进,中国社会已进入了一个崭新的全面转型时期,人们的观念发生了很大变化,很多人尊老敬老养老意识淡化,老年人得不到应有的尊重,社会上出现了许多老年人
通过对我国优秀标枪运动员 2 9人次投掷步技术纪录影片的解析 ,并与世界优秀运动员投掷步有关环节运动学参数变化的对比分析发现 ,我国男子标枪运动员投掷步第 1、2步躯干后
本文针对芯片布图中存在的运行效率问题和亟待解决的热优化问题,层次式的设计思想和分而治之的优化策略,做了如下创新性的工作:针对二维布图规划问题热优化过程影响算法效率
本文针对5kW连续横流CO2激光器,在分析常用的谐振腔的基础上,采用直角内圆锥面反射镜,理论分析并试验研究了失调性能好、高光束质量激光输出的新型谐振腔。论文首先分析了几
目的了解长沙市某医院2015年夏季从腹泻病人粪便中分离到的肠炎沙门菌的耐药性特征及其流行关系。方法经生化和血清学鉴定后,对分离自腹泻病人大便的9株肠炎沙门菌菌株进行药