基于画面内容自适应的高动态范围视频生成算法研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:nathon_zhwang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网技术的不断发展,视频已经成为人们日常生活中重要的信息来源与娱乐方式,而随着硬件设备的不断进步和人们对于画面内容更加贴近真实环境的需求不断增加,高动态范围视频应运而生。高动态范围(High-Dynamic Range,后简称HDR)视频通过更强亮度表达能力,搭配上更大的色域空间,使视频画面更加贴近现实场景,从而实现更好的视频观看体验。而另一方面对于当前依旧拥有很大占比的标准动态范围(Standard-Dynamic Range,后简称SDR)视频,其中不乏很多经典的优质内容,而画面却缺乏足够的表现力。因此,将优质的SDR视频向HDR视频转换的工作开始受到广泛关注。当前业内的普遍算法是在已有的视频色域转换流程基础上,通过更替其中光电转换模块实现初步的HDR视频生成方案,但该方法存在自适应差、亮度过高、色彩退化、暗部色块等问题。为了解决这些问题,本文提出了一套基于视频内容自适应生成HDR视频的算法,包括基于传统方案的效率模式与基于深度学习方案的精细模式。在基于传统方案的效率模式中,针对已有算法自适应差、亮度过高的问题,提出基于画面亮度信息自适应的非线性变换方案进行亮度调节;通过肤色划分与饱和度细化增强解决色彩退化问题;并设定暗部阈值,平滑暗部像素的色度差异解决暗部色块问题。从而完善了基于画面内容自适应的HDR视频生成方案。本方案可以在i7-7800X编码环境下实现HDR内容的实时生成。通过大量的主观实验证明,本方案生成的HDR视频可以较好地保留画面中创作者意图的同时带来更好的视频观看体验。特别地,在对生成的HDR视频和原始SDR视频进行的主观评测中,本方案的平均主观意见分数(Mean Opinion Score,MOS)均高于对应的SDR视频,平均差异质量评分(Differential Mean Opinion Score,DMOS)为5.80,证明方案可行且在视频观感上有显著提升。在基于深度学习方案的精细模式中,主要解决了效率模式中自适应变换曲线切换之间不够平滑、生成视频画面可能存在闪烁的问题。本方案整体流程与效率模式相同,区别在于利用卷积神经网络的强特征提取能力设计的曲线映射网络代替了效率模式中通过经验设计的亮度自适应模块。另一方面,网络采用无参考训练方案来解决当前缺少用于训练网络的SDR/HDR数据集问题。为了在无参考的前提下保证生成的HDR视频拥有更好的效果,突出HDR视频所特有的画面优势,本文提出并设计了用于网络训练的损失函数,包括空间一致性损失函数、亮度控制损失函数与对比度控制损失函数。在对视频进行的主观测试中,本方案的MOS值均高于对应的SDR视频,在绝大多数情况下MOS值高于传统方案,较SDR视频平均DMOS分值为5.966,证明方案可行且画面效果整体优于传统方案,可以有效提升视频观感。
其他文献
高光谱图像由成像光谱仪获得,每个像元有几十到几百个窄带光谱信息,丰富的光谱信息显著增强了其对材料属性信息的检测能力。然而,由于高光谱图像的低空间分辨率,每个像元通常是几种纯物质的混合物。这些混合的观测结果阻碍了高光谱图像分析技术的应用和发展。因此,高光谱解混是高光谱遥感领域的一项重要而富有挑战性的任务,其目标是估计高光谱图像中混合像元的纯净物质及其所占比例。混合像元的纯净物质称为端元,纯净物质所占
学位
接口电路对外面临着电磁信息泄漏的威胁,对内面临着强电磁脉冲的威胁。针对屏蔽法在电磁信息泄漏防护能力上的不足,本文设计并试制了一种利用噪声覆盖有用信息的电磁信息泄漏防护装置,将其应用于计算机系统的接口电路,完成了电磁信息泄漏防护装置的性能验证试验。同时通过试验获取了典型接口电路的失效阈值,基于接口电路的失效阈值,设计并试制了三类典型接口电路强电磁脉冲防护滤波器,同样将其应用于计算机系统的接口电路,完
学位
同时定位与建图(SLAM)指的是机器人在陌生的环境中利用传感器获取的信息进行位姿估计,进而确定移动机器人自身具体位置,并建立与周围环境一致的地图。为了适应移动机器人不同的运动状态和多变的环境,SLAM技术在不断地发展。其中视觉SLAM以相机作为传感器,结构简单且价格低廉,用拍摄的相机帧作为输入,能够收集大量的信息。在快速运动和光照变化的情况下采用视觉和惯性融合的方式提高定位精度。本文主要的研究内容
学位
管路作为飞机液压系统传输能量、执行器作动的“生命通道”,其振动问题是飞行安全的隐患。飞机液压管路在工作环境中承受着泵源输出的高压脉动激励和发动机通过机体传递的随机振动激励,这两大激励源可能会引起管路及其上零部件产生剧烈的流固耦合振动和结构振动,如果管路系统的固有频率接近泵的脉动频率以及发动机基频时,极有可能诱发机械共振。此外,由双泵协同工作输出高压脉动油液经三通接头汇流输出,以满足飞机起飞和降落期
学位
随着互联网与流媒体技术的发展,越来越高质量的视频逐渐成为当今网络数据流量的主流,且其数据体量有愈发庞大的趋势。但实际应用中,由于视频采集设备的限制,导致许多视频的分辨率不足;再经极端带宽条件传输后,视频质量会大大降低。这类视频的质量增强不仅要考虑下采样损伤的修复还要考虑编码损伤的修复,即需要从低质量的低分辨率视频中恢复高质量的高分辨率视频。截至目前,压缩视频质量增强方法和超分辨率方法已经取得了重大
学位
液压系统作为飞机的核心动力来源,其遍布飞机全身的液压管路,犹如人体中的血管组织,是飞机液压系统的重要构成部分之一。飞机液压管路是传送油液工作介质的主要通道,也是构建液压控制回路的重要纽带。现代航空液压系统正朝着高压化、大负载和轻质化等方向发展,液压管路的强度储备越来越少,其疲劳问题愈发突出,如何规避或延缓由疲劳引发的液压管路结构破坏成为了当前军用和民用航空业所面临的共同难题。为此,国内外诸多学者都
学位
量子计算因其基于量子态叠加原理与量子纠缠特性,使得计算能力获得指数级的加速。采用量子算法使得解决某些在经典上困难的问题成为可能。然而,当前量子算法对量子比特需求量的增长远远高于量子计算机的发展速度,这也成为了亟待解决的关键问题之一。而分布式量子计算可将多个量子比特数较少的量子计算机组合起来完成较大规模的量子计算任务,其也成为了解决当前量子计算机比特数量不足问题的一种方案。可是,通过量子网络互联起来
学位
研究目的:目前,青光眼治疗方法主要是降低眼压,临床上许多患者尽管眼压控制良好,但视野仍存在进行性缺损。随着新药的不断问世,PH公司发现了一种新型Rho激酶抑制剂药物PHP-201,PHP-201不仅能够降低眼压,还能保护视神经。本文对PHP-201进行前景分析,为了研究PHP-201是否可以引进中国市场。研究方法:对PHP-201与市场常用治疗青光眼药物的作用机制、不良反应、用法用量和临床疗效进行
学位
目的苯甲酸阿格列汀是口服有效的特异性二肽基肽酶-Ⅳ(Dipeptidyl Peptid-ase Ⅳ,DPP-Ⅳ)抑制剂,用于治疗Ⅱ型糖尿病,由于其市场前景好,对其合成工艺进行研究具有重要的意义。本论文对苯甲酸阿格列汀的合成工艺进行优化,探索适合工业生产的合成路线及合成条件。方法通过3-甲基-6-氯尿嘧啶与2-氰基溴苄的亲核取代反应得到2-(6-氯-3-甲基-2,4-二氧代-3,4-二氢-2H-嘧啶
学位
目的:研发化学仿制药利培酮片,通过体外溶出曲线及行为与体内生物等效性的相关性研究,确定利培酮片的处方组成、制备工艺及关键质量属性要求,使自制品与原研品达到质量、疗效一致性。方法:1.通过对项目的前期调研,初步确定了利培酮片的制备处方及工艺;结合原研品(商品名:Risperdal?)制剂处方,采用湿法制粒压片工艺得到自制品;2.对已购利培酮原料药进行研究,考察其晶型、粒度分布、溶解度、引湿性等指标,
学位