【摘 要】
:
传统的视频编码技术已经很难改进编码效率,而视频的最终接收对象是人眼和大脑,那么我们可以从视觉感知的方向来改进编码技术。本文提出一种基于空时域感知特性的失真模型,为
论文部分内容阅读
传统的视频编码技术已经很难改进编码效率,而视频的最终接收对象是人眼和大脑,那么我们可以从视觉感知的方向来改进编码技术。本文提出一种基于空时域感知特性的失真模型,为感知视频编码算法优化提供理论和模型支持。主要研究如下:1.利用HVS的中心凹掩蔽效应和视觉注意效应,本文提出一个自适应中心凹权重模型,用来改进传统的中心凹JND(FJND)模型。一方面,传统的FJND模型无法获得注视点的准确位置。在本文中,提出一个基于视锥细胞分布的注视区域预测算法,用来预测注视点和注视区域;另一方面,传统的FJND模型没有结合视觉注意效应。结合中心凹掩蔽效应和视觉注视效应,利用视网膜的离心率和高斯混合模型拟合的显著图估计的注视强度,得到一个自适应中心凹权重模型。实验表明,与传统的FJND模型相比,所提出的FJND模型在相同的感知质量下,可以隐藏更多的失真。2.现有的JND模型没有充分利用时域感知特性,只考虑了空域感知特性。针对HVS时域感知特性,本文主要分析视频场景中视觉感知显著度和不确定度之间的关系。根据视频目标的视觉注意激励源,如相邻帧之间的相对运动和时域运动轨迹上的持续时间,采用自信息度量视觉感知显著度;根据视频目标的视觉感知不确定度源,如摄像头运动导致的背景运动和时域运动轨迹上的帧间残差波动强度,采用信息熵度量视觉感知不确定度。在自信息和信息熵的统一尺度上,将映射到相同量纲的四个时域感知特征参量进行融合,得到一个时域权重模型。利用时域权重模型去改进自适应FJND模型,得到最终的空时域JND模型。主观实验表明,所提出的空时域JND模型在性能上有了明显的改进,具有更高的隐藏失真的能力,优于现有的像素域JND模型。
其他文献
随着信息化技术与工业的快速融合,极大地激发了工业自动化的发展潜力,工业自动化的发展离不开自动化设备的研发,自动化设备应包含有“思想”的智能化部件。在力矩测试领域,高
创业决策逻辑对新企业的未来发展至关重要。Sarasvathy(2001)认为个体在进行各种决策活动时有两种思考方式,即因果逻辑与效果逻辑。现有文献聚焦于因果逻辑、效果逻辑实施效
随着互联网的飞速发展,人们也由以前的被动接收信息,逐步向主动参与转变,更乐于通过微博、博客、论坛等互联网平台公开发表自己的看法与观点。互联网每天都会产生大量的非结
随着互联网的飞速发展,多媒体视频的数据量呈现快速增长,视频的内容结构也正趋于复杂,如何有效存储和管理这些视频数据显得尤为重要。视频摘要是对完整视频的概括,在保留原始信息的同时压缩了视频长度。一种有效的视频摘要提取技术能够大大降低视频的存储空间,提高视频分析的效率。本文主要研究视频摘要技术中镜头分割和关键帧提取技术。主要工作如下:1.提出一种结合颜色和深度信息的突变镜头边界检测算法,针对现有突变镜头
污水处理厂作为一项最基础的公共设施,近些年来其建设和运营广泛采取PPP模式,对污水处理PPP项目进行绩效评价研究,可以使项目实施和运营过程中的绩效水平在一定程度上得以提
随着人口老龄化时代的到来,年长员工的比例逐步增加,劳动年龄人口表现出老化趋势。面对未来年轻劳动力短缺、劳动力老龄化的发展趋势,如何保留、开发和管理年长员工的人力资
亚硫酸盐(SO32-)、半胱氨酸(Cys)和同型半胱氨酸(Hcy)是一类含有硫原子的生物活性硫小分子物质,这类物质普遍存在于生物体内,参与生物体内的各项生理功能,维持体系平衡。但是,当
本文探讨了一种特殊类型的土地抵押形式——"土地分割抵押";该类型在实际工作中运用较多,各地操作方式不一,文中观点仅为个人对相关政策的理解而作的分析。
近年来,三维(Three Dimensional,3D)多媒体应用已经逐渐走进了人们的日常生活中,例如3D电影和虚拟现实应用等。人们在享受着3D图像以及视频内容带来的便利的同时,对图像和视
近年来,我国在国防、能源、交通、通信等领域的大型基础设施建设显著增长,基建规模达到世界第一。这些大型基建的服役时间较长,不可避免的会受到结构老化、自然灾害和人为破