【摘 要】
:
随着信息技术与通讯技术的蓬勃发展,视频作为一种新兴的信息载体越来越受到人民群众的重视。由于成像设备与运输条件的不足,显示端的视频往往存在着分辨率低、质量差的缺陷。因此,能从低分辨率视频序列帧中恢复高分辨率视频帧的视频超分辨率(Video Super Resolution)成为了近几年的一个蓬勃发展的研究主题。而从视频超分辨率的普遍的两种不同评价指标(即重建精度和视觉感知)的角度出发,视频超分辨率可
论文部分内容阅读
随着信息技术与通讯技术的蓬勃发展,视频作为一种新兴的信息载体越来越受到人民群众的重视。由于成像设备与运输条件的不足,显示端的视频往往存在着分辨率低、质量差的缺陷。因此,能从低分辨率视频序列帧中恢复高分辨率视频帧的视频超分辨率(Video Super Resolution)成为了近几年的一个蓬勃发展的研究主题。而从视频超分辨率的普遍的两种不同评价指标(即重建精度和视觉感知)的角度出发,视频超分辨率可按照评价指标重建精度和视觉感知分为两类方法,即基于重建精度和基于视觉感知的方法。基于重建精度的方法往往会通过增加深度学习网络的深度和宽度来提高重建视频的精度,但这样往往会导致网络的复杂度增加,从而导致算法的实际应用困难。基于视觉感知的方法则使用生成式对抗网络生成符合人体视觉感知的视频,但这样会导致在重建视频帧中引入大量噪声,导致重建精度大幅度降低。基于以上分析,为了生成更高质量的视频超分辨率结果,本文对现有视频超分辨率方法进行研究,并进一步提出改进方法,提出了两个基于超卷积对齐的视频超分辨率方法。本文的贡献如下:(1)针对基于重建精度方法中计算复杂度高的问题,本文提出了基于超卷积对齐的递归视频超分辨率方法,以流式处理输入的递归网络框架拥有的低延迟优势以及优越性能在视频超分辨率中有极大的优势;为了更好地利用过去帧中的时间信息,本文提出了一种新的基于超卷积对齐的高维特征对齐方法,该方法帮助实现了高效且精确的视频超分辨率性能;此外,本文还在多个先前的隐状态和当前的低分辨率输入之间引入密集连接,以便更有效地传播过去隐状态的时间信息。实验表明,提出的算法降低复杂度的同时取得了更好的重建精度。(2)针对基于视觉感知方法中重建精度差的问题,本文提出了基于超卷积对齐的指导式对偶网络的视频超分辨率方法。为了追求视觉感知和重建精度的良好均衡,该算法模型引入目前有利于生成符合人眼感知的视觉图像的生成式对抗网络和高重建精度的视频超分辨率网络组成对偶网络,以生成具有良好视觉感知同时保持重建精度的高质量视频序列。与主流的视频超分辨率方法相比,以上两个工作实现了重建精度高同时计算复杂度低、视觉感知高且重建精度高的均衡,相应的实验也验证了所提出方法的有效性。本文针对真实场景痛点,提出的两个算法分别兼顾了模型规模与模型精度、重建视觉感知性能与重建精度,对于实际工业有一定研究意义。
其他文献
目前在企业和行业的各种场景中流行使用面部生物识别技术验证用户身份。与其他生物识别技术相比,人脸面部图像获取代价较低,存在多种成本低廉的攻击方式,因而人脸识别系统存在着巨大的安全隐患。人脸反欺诈(Face Anti-Spoofing,FAS)在防止人脸识别系统遭受欺诈攻击方面举足轻重。得益于深度神经网络强大的特征提取能力,基于深度学习的人脸反欺诈算法取得比基于传统手工特征算法更好的性能,成为近期的研
在飞机向多电/全电化的发展趋势下,机电作动器(Electromechanical Actuator,EMA)越来越多地应用在飞机上,主要是用在飞行控制系统中。一般作动系统都带有余度,这是为了满足了可靠性的要求,但是其带来的力纷争问题可能会对飞机的性能、结构等造成较大影响,从而降低飞机的安全性。为了研究并解决余度机电作动系统中存在的力纷争问题,本文建立了双余度机电作动系统的数学模型,并设计了EMA的
在过去的十几年间,区块链技术得到了巨大的发展。基于去中心化的公有链搭建的货币系统层出不穷,在全球范围内吸引了大量用户。去中心化的公有链看似是未来金融系统的不二选择,其实不然,公有链系统存在四大缺陷。第一,公有链与中心化金融系统相比,交易吞吐量太低。比特币和以太坊的峰值交易吞吐量仅为每秒7笔和15笔,而VISA峰值为24000笔,支付宝峰值为256000笔。第二,公有链出现了中心化的趋势。比特币和以
“哈龙”灭火剂因破坏臭氧层被禁止使用,寻找环境友好和灭火性能优越的替代灭火剂成为急需解决的焦点问题。民用飞机由于运行环境特殊且一旦发生火灾救援难度较大,所以机载灭火剂除了具备优越的灭火性能还需满足飞机适航性相关标准。民用航空界一致认为与哈龙性能相近的化学灭火气体是最可能的哈龙替代品。然而化学灭火气体数以十万计,性能差异较大,所以研发综合性能优良的新型高效化学灭火气体的工作量较大。而探究化学灭火气体
超声成像是医学成像领域的主要模态之一。深度学习技术具有强大的学习能力,拥有广泛的应用前景。近几年来,超声成像与深度学习技术结合的研究方兴未艾,在波束形成后数据合成、下采样恢复、波束形成等方面取得了一定的研究进展。然而,目前的研究工作还比较有限,代表性工作偏少。波束形成是超声成像的关键步骤,因此探索波束形成与深度学习技术的结合对超声图像质量的提升具有重要意义。由于其强大的学习能力,深度神经网络可用来
飞机在服役过程中承受不同形式动载荷的作用,这些动载荷的确定对故障诊断、设计优化等具有重要意义。但是受限于工程实际中的复杂情况,往往无法使用力传感器直接获取动载荷数据。因此,有必要研究一种基于结构振动响应来间接获取动载荷的技术。本文针对谐波载荷和冲击载荷建立不同的识别模型,基于GARTEUR模型验证载荷识别方法的有效性,基于数值计算与试验相结合的方法探究载荷识别模型的适用性。并以某型飞机全尺寸有限元
伴随着飞机可靠性的提升,人的因素作为保障民航安全和效率的关键要素已被广泛认可。但是近年来,飞行机组因素却已成为诱发飞行事故的重要原因。飞机运行过程中,存在大量的工作应激源,适当的应激反应能够增强飞行机组的警觉性,提升突发事件的处置水平,可是应激反应一旦过强,则会诱发人的差错,严重威胁飞行安全。本研究旨在探究工作任务应激下差错发生时飞行员的多种生理指标参数值的差异,分析差错与应激的关系,对飞行差错进
CCAR33部第21条中明确规定:发动机的设计与构造必须在飞机预定工作条件下提供必要的冷却。气膜冷却在涡轮叶片冷却中起到了非常重要的作用。但是在涡轮设计过程中,为保证航空发动机的安全性和经济性,即在保证冷却效果的前提下将掺混损失降低至最小,快速准确地预估掺混损失成为了一个重要的课题。本文采用数值模拟的方法,围绕叶栅环境下冷气射流与主流掺混过程中对流场与掺混损失的影响这一问题,对相关内容展开系统的研
组合优化是最优化中与算法理论、运筹学相关的一个分支,在人工智能、软件工程、理论计算机科学等领域都有重要的应用。在结构化组合优化问题中,背景数据不是由单一的数据类型构成,而是由存在相互依赖关系的多个数据模块组成。不同问题样例的背景数据维度差异较大,难以用固定规模的机器学习模型处理。尽管已有研究人员尝试借助机器学习方法解析组合优化问题信息模块间的相互依赖关系,但现有的基于学习的组合优化算法仍然缺乏合适
问题生成是自然语言处理的一个热门研究话题,有着丰富的应用场景,可以促进教育、对话系统、阅读理解等领域的研究与发展。最近几年,问题生成领域快速发展,研究学者提出许多方法来生成各式各样的问题。然而,在视觉问题生成领域,目前大部分研究仅仅基于图像来生成问题,而忽略了问题的难度。问题的难度在评估生成问题的质量中扮演着十分重要的角色。为了吸引用户,一个优秀的自动问题生成器应根据用户的能力和经验生成不同难度的