基于H.264/AVC的视频压缩关键技术研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:lxkef
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
H.264/AVC是由ITU-T VCEG(Video Coding Experts Group)和ISO/IECMPEG(Moving Picture Experts Group)联合制定的新一代视频压缩国际标准。H.264/AVC以其强大的压缩性能和良好的网络亲和力,被广泛应用在各种视频业务中。本文详细地介绍了H.264/AVC的应用范围、档次和级别、编解码器结构以及各种新的编码技术和工具。特别地,在研究帧间预测和帧内预测技术的基础上,提出了一种改进的EPZS(Enhanced Predictive Zonal Search)运动估计算法和一种边缘方向信息和空间相关信息相结合的快速帧内模式选择算法。文中给出了这两种算法的详细介绍和实验分析结果。在分析之前运动估计算法的性能以及不足之处的基础上,本文提出了一种使用具有方向偏向性搜索模板和基于预测模式自适应选择运动估计方案的EPZS改进算法。该算法将运动估计过程与H.264/AVC中多参考帧、多预测模式等编码工具紧密结合,充分利用了视频中运动具有高度时空相关性的特点,综合考虑了速度、图像质量及压缩效率等方面的性能。实验结果表明,该算法以极小的计算量得到了与全搜索方法接近的效果;与EPZS算法相比,运动估计的处理速度有了较大幅度的提高,同时保持了与之相当、有时甚至更优的率失真性能。此外,该算法具有很好的鲁棒性,并且能够产生平滑的运动矢量场。针对编码器需要遍历各种帧内预测模式以得到率失真性能最佳的帧内模式所带来的复杂度高、计算量大的问题,本文提出了一种边缘方向信息和空间相关信息相结合的快速帧内模式选择算法。算法首先利用图像的局部边缘信息和当前编码块空间邻近块的预测模式信息,选择少量的可能性很高的预测模式作为侯选预测模式,然后再对这些侯选模式进行RDO(Rate Distortion Optimization)计算,最后得到最佳的帧内预测模式。由于参与RDO计算的模式数量很少,帧内模式选择的速度可以获得显著的提高。
其他文献
软件规模作为软件项目可量化的结果,是项目估算的重要参数和企业决策的重要依据。因此在软件项目需求阶段,就需要度量软件规模。在现有的规模度量方法中,功能点方法能够用于
随着手机使用的普及,人们享受着现代化通信手段带来的快捷方便,短信业务也得以迅速发展,但伴随而来的问题是垃圾短信已经严重地影响着广大手机用户的正常使用。这一现象不仅在我
近年来,互联网已成为全球最大、最广泛使用的信息库,如何有效检索其中的海量信息成为当前重要的研究课题,因此信息检索技术越来越受到人们的重视。用户将表示自己需求的查询提交
基于单目视频序列的人体运动姿态分析是计算机视觉和计算机图形学相互融合的一个重要研究方向,其研究核心是从单个或多个视频序列中检测、跟踪人体,获取人体运动数据,重建人体的
随着多媒体技术、视频压缩编码技术、网络通信技术的发展,数字视频监控系统迅速崛起。前端一体化、视频数字化、监控网络化、系统集成化是视频监控系统公认的发展方向,其中以嵌
数据挖掘是指从数据库中抽取隐含的,具有潜在使用价值信息的过程,是一种新型的数据分析技术,已经被广泛的应用于金融,保险,政府,教育,运输以及国防等领域。聚类是数据挖掘领域中最活
数据挖掘又称数据库中的知识发现,是指从大型数据集中发现有趣的、有用的且预先未知的知识的过程。数据挖掘是数据库研究最活跃的领域之一,通过数据挖掘可以从大型数据集中提取
延长集团炼化公司是陕西省的重点发展企业,随着企业信息化进程的推进,该企业在使用原有信息平台系统的过程中遇到了很多问题。尤其是当企业组织机构和业务流程发生改变时,原
XML(Extensible Markup Language可扩展标记语言)技术的出现使得对各种不规则信息、规则信息的标准化描述成为可能,并逐步成为Internet中描述数据的标准。XML的自描述性使得X
脑电信号(EEG)的存在为研究脑的病理、生理、认知等功能状态提供了有效的手段,但是,EEG 信号非常微弱(一般在5-100 微伏),而且很容易被外界伪迹干扰。因此,EEG信号中的伪迹消除成