JND模型及其在视频编码中的应用

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:hnnydbw2007
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
传统视频编码主要是基于统计相关性去除空间、时间冗余,以达到尽可能高地压缩效果。然而作为视频最终的接受者,人类视觉系统(HVS)由于自身的一些特性,存在着感知冗余。为了得到这种感知冗余,研究者们已经做了大量的工作。其中广泛接受的是最小可觉察误差模型(Just-Noticeable-Distortion model, JND model),该模型模拟了人类视觉系统的两大特性,即亮度对比度和时空域掩藏效应,得到一个阈值。当变化值低于阈值时,人眼将不会感知到这个变化。将JND模型应用到视频编码中,对于JND阈值大的区域,由于敏感性低,可以压缩得大些,反之,压缩得小些,最终在码率基本不变的前提下,达到更好的主观感受。随着3D电影《阿凡达》的热播,全世界产生了3D热。3D效果是由多个视点的视频合成的,包含了大量的数据,由于带宽的限制,如何对多视点视频高效地压缩显得至关重要了。传统的多视点编码考虑了帧内、帧间、视间的统计冗余,然而如同单视点编码,可以发掘基于多视或立体视的JND模型,然而将其应用于多视点或立体视编码中,将可以达到更大的编码效果。本文首先提出了一个多视JND模型(MJND),不仅考虑了时空域的掩藏效应,同时还考虑了深度图上的视觉冗余,通过主观实验与未考虑深度信息的其他JND模型相比,MJND模型能够更好地吻合视觉感知冗余。然后,将MJND模型应用于传统多视点编码(MVC)中,自适应量化步长和改进RD决策最优化。通过与传统编码框架进行对比时,在码率近似相同的情况了,MJND修改的MVC将得到更好的主观质量。为了具体应用于立体视中,本文针对左右两个视点的立体视频,提出了一个双视JND模型(NBJND),通过仔细观察,左右视点合成的立体场景由三部分构成:边缘区域、立体区域、共有区域。由于边缘和立体区域的独有性,NBJND模型采用传统的JND模型,而对于共有区域,本文通过主观实验得到一个视间JND模型(IJND model),来描述其存在的视间掩藏效应。通过与其他模型的对比,NBJND模型能够更好地吻合立体视频的感知冗余。最后,将NBJND模型修改成立体图像的JND模型,将修改的JND模型与SSIM结合,应用于立体图像的质量评价中,实验结果显示,提出的客观质量评价标准能够较好地吻合主观质量感受。
其他文献
在Internet发展的初始阶段,网络资源比较稀少,信息资源的查找比较容易。随着互联网的迅猛发展,Web中所容纳的信息量呈现指数级增长。面对海量的网络信息资源,如何快速高效地完成
随着生物信息学的发展,人们研究集中在蛋白质和DNA等生物大分子。蛋白质分子在生物体内执行着各项重要任务,而蛋白质相互作用是维持细胞结构和功能的基础,因此对蛋白质相互作用
如何解决语言的歧义问题一直困扰着自然语言处理技术的研究人员。语言的歧义最重要的一个表现就是一词多义现象。如何根据歧义词出现的上下文语言环境识别出正确词义是词义识
随着信息技术的发展,涌现出了大批的社交软件,如Facebook、微博等,越来越多的人通过软件来交友、互动,出现了很多的虚拟好友关系,针对社交网络的好友推荐、社团发现等成为研
物联网直观上是一个连接物品的互联网,是下一代网络和Internet发展的必然产物。其中物联网中间件作为物联网技术的神经中枢,扮演着硬件和应用程序的中介角色,它向下提供底层接口
网络化、高清化和智能化是视频监控技术的发展趋势。伴随着视频监控技术的快速发展,出现了如海量高清视频数据传输速度慢和存储难度大等问题。本文主要针对这些问题,基于传统
异构多核体系结构是由多个在大小、性能以及复杂性等方面不同的核组成的一个片上多处理器。与传统的片上多处理器(同构多核)相比,在相同的面积下,这种结构可以提供很大的性能提
目标检测是计算机视觉和模式识别领域的重要研究方向,是从低层的图像处理到高层的图像理解这个过程中一个关键的步骤,因此目标检测也一直是研究的重点和热点。由于图像中目标丰
由于小麦品种的遗传类型、环境条件、栽培技术和一些其他因素的影像,小麦蛋白质含量往往不同。这给小麦的使用带来了很大的麻烦,因为不同小麦制品对小麦籽粒的要求不同。在实际
本文主要研究了神经网络的相关理论,研究了BP神经网络的训练过程、基本算法并做出相应改进即将全部误差累加求和之后集中修改权值,消除了原算法中样本数据的顺序对结果的影响