AVS视频编码器中熵编码及运动估计的研究与优化

来源 :山东大学 | 被引量 : 0次 | 上传用户:jeffyi2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数字音视频编码技术标准(Audio and Video coding Standard,AVS)是我国自主制定的、具有自主知识产权的第二代音视频信源编码标准。与国际上流行的其他音视频编码技术标准相比,AVS具有性能高、计算复杂度低、专利授权费用低等优点,它的实施对于我国发展自主的多媒体文化产业具有非常重要的经济效益和社会意义。该标准一共包括9个部分,其中第二部分(AVS-P2)和第七部分(AVS-P7)为视频编码标准。目前AVS标准组已经发布了视频编解码的企业版参考软件。为了实现高效压缩,AVS-P2采用了大量类似于H.264/AVC中的新技术。这些技术包括:帧内预测;可变块大小的运动补偿;多参考帧预测;1/4像素精度的运动矢量;整数余弦变换;基于上下文的二维变长编码和指数哥伦布编码;环路滤波等。采用了这些先进的视频编码技术后,AVS的压缩效率和解码质量都有了很大的提高。但是这些先进编码技术既增加了基本模块的复杂度,也成倍提高了算法的复杂度,使得视频编码器的时间效率、编码速度比较低,不利于AVS的实际应用,尤其是在实时视频通信以及其他一些对实时性要求比较高的领域的使用。本课题的研究目的就是对AVS-P2视频编码器进行优化,研究编码器核心模块的快速算法,提高编码器的编码速度,为其在DSP等硬件平台上实现实时高效编码打下坚实的基础。基于上述思路,论文的主要工作包括:首先,简要介绍了国内外流行的视频编码标准,将AVS视频标准与H.264/AVC进行了简单比较,并详细介绍了AVS视频编码标准的编码结构框架和编码流程,以及帧内预测、帧间预测、变换与量化、熵编码、环路滤波等关键技术。然后对AVS所采用的关键熵编码技术:基于上下文的二维变长编码(2D-VLC)和k阶指数哥伦布编码进行了研究、优化。修改了2D-VLC编码中使用的19个码表(VLC table)的存储结构,改变了码表之间的切换方法,节省了约86%的VLC table存储空间;对由查表得到的symbol的分布规律进行了大量实验统计,并根据实验统计结果采用了新的k阶指数哥伦布编码方法,缩短了编码时间。最后,重点对AVS视频编码器中的核心部分运动估计进行了算法及程序上的研究,特别是亚像素运动搜索快速算法的研究与改进。针对不同运动程度的视频序列,对宏块亚像素运动搜索后得到的最优匹配位置的分布规律进行了大量的实验和统计分析,并提出了一种基于宏块/块运动剧烈程度的亚像素搜索策略;而且针对运动剧烈宏块的亚像素运动搜索后最优匹配位置的分布特点,提出了一种适用于大运动的亚像素快速搜索算法:大小棱形搜索法(Big-Small Diamond Search,BSDS);并将上述基于块运动剧烈程度的亚像素搜索策略和大小棱形搜索法结合起来,得到一种新的块运动自适应的亚像素快速搜索方法,该方法能够在保证压缩质量几乎不变的前提下节省编码器10%-25%的总体编码时间,显著提高了编码器的速度。
其他文献
正交频分复用(OFDM)技术是一种多载波传输技术,因为它具有较强的抗干扰和抗衰落特性,因此受到人们广泛的关注。目前OFDM技术已经广泛应用于IEEE802.lla、HiperLAN/2和MMAC等
随着微型计算机控制技术、电子电力技术、电机控制理论的迅速发展,永磁同步电动机因其优良的性能和多样的结构,在工农业生产、日常生活、航空航天和国防等各个领域中得到广泛应用。因而,对永磁同步电动机调速控制系统的研究具有重要的理论意义和实用价值。本文以专用电机控制芯片STM32为控制器,其内核为Cortex-M3,采用矢量控制型的变频调速装置,实现永磁同步电动机的调速控制。本文主要的研究工作有以下几个方面
无线射频识别技术(RFID)是一种非接触的自动识别技术,具有识别距离远、穿透能力强、多物体识别等优点,现已广泛应用于自动化、交通运输、控制管理、产品服务、证件防伪等领域
多输入多输出(MIMO)技术作为一项不断成熟的技术被包含进新兴的的无线宽带标准,成为现代无线通信系统标准中的关键技术,如长期演进(LTE)项目。一般地,发送端或接收端配置的天
P2P技术打破传统C/S模式的限制,成为互联网新时代的主流技术之一。越来越多的人们享受着P2P技术带来的便利,而与此同时,新的P2P应用还在不断涌现。然而,伴随着P2P技术的飞速
混沌现象是在非线性动态系统中出现的一种确定性的、类似随机的过程,这种过程非周期、是一种貌似无规则的运动,不收敛但有界,且对初始值具有极其敏感的依赖性,这些独特的性质