基于DCT域的系数分级预判与视觉优化算法研究

来源 :江西理工大学 | 被引量 : 0次 | 上传用户:jettey
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息时代的发展,高清晰度的视频越来越受人们的青睐,视频编码技术也显得日益重要。H.264/AVC是VCEG和MPEG两大国际组织联合推出的视频编码标准,也是目前最流行的视频标准之一。该标准吸收了以往视频标准的优点,同时引进了多种先进的编码技术,使得其编码效率比以往标准至少提高了一倍以上。然而与此同时,也带来了大量的复杂编码运算量。因此,针对H.264/AVC视频编码算法进行性能优化,在保证编码质量的前提下降低编码的复杂度具有重要的现实意义和应用价值。本文围绕H.264/AVC标准中DCT域的编码算法,主要做了以下内容的研究工作:(1)针对运动补偿后的残差块经过4×4整数离散余弦变换(DCT)及量化过程后出现大量的零值量化系数(ZQDCT)而导致的冗余计算问题,在分析提取出最佳全零块判决阈值的基础上,结合高斯分布模型和DCT系数能量“Z”形分布特性,提出了基于该新阈值的零值量化系数分级预判算法,在残差块DCT变换之前按分级模式预判出ZQDCT,从而跳过其变换量化操作。实验结果表明,与标准算法相比,该算法明显降低了编码数据量,同时减少了最高达42%的离散余弦变换(DCT)、量化(Q)、反量化(IQ)以及离散余弦反变换(IDCT)过程计算时间。(2)结合人类视觉系统特性,将基于DCT域的恰可察觉失真(JND)模型应用于H.264标准算法中。由于人眼是视频图像的最终接收者,其对于DCT系数中低频分量具有更大的敏感性,而高频部分可能含有较多的视觉冗余系数。JND表示人眼不能察觉的最大图像失真,反映了图像中不可感知的视觉冗余信息。算法根据不同的4×4 DCT变换块计算出相应的JND阈值,对每个变换后的DCT系数进行过滤,其中对应位置比JND阈值小的DCT系数直接舍弃,从而去除视频图像中存在的主观视觉冗余。同时对舍弃后相应的DCT系数跳过其量化等操作,节省运算量。实验仿真结果表明,该JND模型能节省编码码率,同时对视频图像质量并不影响,对视频编码中的视觉冗余优化取得了良好的效果。本文通过对H.264标准中的DCT变换与量化过程的研究,利用分级预判算法将ZQDCT系数进行提前预判并跳过其DCT部分的编码,节省了运算量;另外从人类视觉系统的角度,对DCT域的视觉冗余进行了分析并提出算法进行过滤相关冗余系数,优化了编码的视频图像质量。
其他文献
随着多媒体技术和网络技术的飞速发展和广泛应用,数字多媒体产品的存储、处理和传输变得越来越方便和快捷,多媒体的真实性认证和版权保护问题显得越来越重要。然而,因为多媒
传统的搜索引擎将网页和链接作为处理单位,对于用户的查询,按照网页与查询的重要程度排序返回给用户,但随着互联网中大量重复网页和作弊链接的存在,使得利用网页排序算法返回
在软件工程中,自然语言描述需求说明文档的做法应用广泛,典型的如使用UML建模工具。但是,自然语言的多义性、上下文有关性、非系统性等特点致使其在描述复杂系统时可能引起语
随着互联网的飞速发展,网络信息量不断增加,垃圾网页也逐渐增多,这极大影响搜索引擎的精度和效率,如何在海量信息中寻找到高质量的搜索结果,以满足用户需求变得越来越重要。
说话人识别技术在计算机智能接口和人机交互方面有着重要的应用价值。其任务是用计算机分析说话人的语音,得到有关个人的特征,并由此识别出人的身份。目前在说话人识别中,常
本文结合了电力系统的实际需求,查阅了国内外大量文献资料,对数据仓库、OLAP、数据挖掘、电厂机组数据评测的基础理论和关键技术,及Oracle数据分析技术,进行了深入有效的研究
随着互联网技术的高速发展,身份认证技术得到了广泛的应用,传统的密码认证技术已经不满足当今社会的要求,生物特征识别技术应运而生。虹膜识别技术以其独特的生物识别优越性
随着网络的深入、普及,电子邮件已经成为交流和沟通的重要工具,但垃圾邮件也随之激增。其中,图片垃圾邮件的暴利使得越来越多的人对此趋之若鹜,也造成了如今图片垃圾邮件形势
分类问题在人们的日常生活、社会活动、科研生产以及学习、工作中经常遇到。在很多领域中,分类问题都是需要解决的主要问题,比如医学的临床诊断、工业生产的机器状态判断、语
基于生物特征的认证可以使用用户的指纹或者虹膜等生物特征信息来恢复预先分配给他的密钥。本文改进了Hao等人使用生物数据对密钥进行保护的方案,使用Reed Muller码和Hermiti