论文部分内容阅读
自三维立体视频技术盛行以来,人们对三维视觉体验服务品质的追求逐步提升。而立体视频系统中的观看舒适性和画面质量是与三维视觉体验最为紧密相关的两个影响因素。因此,建立符合人眼主观感知的立体视频/图像视觉舒适度和质量评价模型便成为优化立体视频技术以增强三维体验感的一个关键性技术。本学位论文专注于视觉舒适度和视觉质量这两个方面,结合人眼视觉感知特性开展立体视频图像的视觉舒适度及质量评价研究。具体研究内容如下:(1)根据人类视觉系统的感知特性对立体图像感知质量的影响,提出了一种基于双目视觉感知的无参考立体图像质量评价方法。本方法从人眼视觉的双目融合和双目竞争现象出发,构建了立体图像对的会聚独眼图,同时考虑人眼的立体感知特性,建立了不确定图和视差图;接着根据人眼的多通道特性,将会聚独眼图变换到曲波域,提取曲波分解后的特征,另通过自然场景统计分析,在不确定图和视差图上提取统计特征;最后利用支持向量回归预测得到客观质量评价值。在包含对称和非对称失真的LIVE PhaseⅠ和PhaseⅡ两个数据库上,该方法的Pearson线性相关系数(PLCC)值均在0.94以上,Spearman等级相关系数(SROCC)值均接近0.94,优于相关代表性的平面和立体图像质量评价方法,表明所提出的客观评价模型与人类主观视觉感知具有良好的一致性。(2)针对现有的通过回归模型来缩小视觉舒适度特征和主观评价值之间差距的视觉舒适度评价方法需依赖大量样本的局限性,并结合人眼视觉的不舒适感知特性,提出了一种基于不舒适感知与组稀疏编码的立体图像视觉舒适度评价方法。首先,根据人眼的视觉注意机制和双目融合极限,提取潜在显著不舒适区域视差特征和空间频率感知视差特征;然后,对特征按照主观评价值进行不舒适程度分组,并通过聚类构建不舒适感知字典;最后,通过加权在字典上进行组稀疏编码得到的组稀疏系数和设定的每组不舒适程度值,预测得到客观视觉舒适度评价值。对于IVY LAB和EPFL立体图像库,本方法在预测精度和泛化能力方面都比相关代表性的立体图像视觉舒适度评价方法具有更好的性能,更加接近人眼的主观感知。(3)针对人眼观看立体图像内容时可能存在的视觉不舒适性,基于视差对立体图像视觉舒适度的影响,提出了一种基于两阶段视差重映射的立体图像视觉舒适度提升方法。考虑到视差缩放方式在改善视觉舒适度的同时,会出现场景立体感被过度削弱的问题,由此就欠舒适的立体图像设计了一个两阶段的视差重映射策略来控制视差缩放程度,分别是视差范围的全局线性重映射和针对提取的潜在欠舒适区域内视差的局部非线性重映射;此外为自动指导视差重映射过程,利用结合人眼视觉不舒适感知特性提取的全局和局部特征构建了客观的视觉舒适度预测模型。在IVY LAB立体图像舒适度测试库上的实验结果表明,相较于相关代表性的视觉舒适度提升方法对于欠舒适立体图像的处理结果,所提出方法在保持整体场景立体感的同时,能更有效地改善立体图像的视觉舒适度,从而提升立体图像的整体三维体验。