视频的超分辨率重建技术研究

来源 :北京邮电大学 | 被引量 : 0次 | 上传用户:ooo4zhgr
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着经济和社会的发展,社会生产和生活中对高分辨率图像和视频的需求持续增长,然而受成像设备性能、成像环境限制以及经济、时间等因素的影响,在某些情况下人们获得的仍然是低分辨率的图像。将低分辨率图像重建为高分辨率图像的超分辨率重建技术为人们获得高分辨率的图像提供了经济可行的解决方案。在过去几十年中,超分辨率重建技术的研究取得了很大的进展,尤其是近年来提出的压缩感知理论、深度学习理论为超分辨率重建技术注入了新的血液,算法的性能得到了进一步提升。本文围绕视频的超分辨率重建开展研究,重点研究了基于矩阵补全模型的超分辨率重建技术和基于深度学习模型的超分辨率重建技术。本文的主要工作和创新点如下:(1)针对以 MCSR(Matrix Completion Super-Resolution)算法为代表的基于矩阵补全模型的视频超分辨率重建算法无法有效处理视频中的局部复杂运动的问题,本文提出了一种基于矩阵补全模型的鲁棒的视频超分辨率重建算法。在运动补偿阶段,该算法提出了一种多尺度非局部块匹配方法,它利用图像的自相似性,能从较少的相邻帧中提取到足够数量的图像块构造低秩矩阵,既能有效保留边缘信息,又能提高算法对局部运动的鲁棒性。实验结果表明,采用本文提出的块匹配算法能解决MCSR算法无法有效处理复杂视频的问题;在高分辨率重建阶段,设计了一个加权平均策略来求取高分辨率图像块,进而能更精确地重建高分辨率视频帧。仿真实验结果表明:本文提出的加权融合策略能进一步提高重建图像的 PSNR(Peak Signal to Noise Ratio)值约 0.14-0.40dB。(2)针对 SRCNN(Super-Resolution using Convolutional Neural Networks)进行较高倍率重建时重建图像边缘不够光滑、存在振铃效应的问题,本文提出了一种边缘保持的单幅图像超分辨率重建算法。SRCNN是第一个端到端的用于单幅图像超分辨率重建的卷积神经网络。与SRCNN相比,本文算法使用了固定的3 × 3的小卷积核取代了 SRCNN中9×9和5×5的卷积核,以更好地提取梯度信息;同时将网络层数由3层增加到6层,提取的特征映射数量比SRCNN扩大一倍,重建出边缘更加清晰的图像。因为网络模型需要学习的参数数量增加了,所以本文算法使用了更大的训练集进行训练,避免发生过拟合。实验结果表明,尽管在SRCNN提供的小训练集上算法的性能提升不明显,但是在ImageNet这类大训练集上,相比SRCNN,本文算法在不同测试集的平均PSNR值最高可提升0.52dB(放大倍数为2),最低可提升0.08dB(放大倍数为4)。在放大倍数为4的情况下,尽管本文算法在PSNR值上的提升不明显,但其重建的高分辨率图像主观视觉效果相比SRCNN提升明显,具有更加光滑的边缘,振铃效应也得到了抑制。本文提出的单幅图像超分辨率重建算法可以直接应用于视频的超分辨率重建,它虽无法利用帧间信息,但也不需要进行复杂的运动补偿。(3)基于三维卷积神经网,提出了一种结构保持的快速视频超分辨率重建算法。大部分基于卷积神经网的视频超分辨率重建算法使用二维卷积进行特征提取,其过程与单幅图像超分辨率重建并无不同,而本文算法提出在高分辨率重建过程中使用三维卷积沿着空间维度和时间维度提取三维特征,能够有效提取视频的帧间信息。为了保持图像结构信息,本文算法使用 MSE(Mean Square Error)损失函数结合 MS-SSIM(Multi-Scale Structure Similarity Index Measure)损失函数优化网络模型。此外,除了运动补偿后的视频帧,运动补偿阶段估计的光流和原低分辨率视频帧也参与高分辨率重建,为重建步骤提供更多的信息。本文算法能够从输入的低分辨率图像直接重建高分辨率图像,由于该模型的运动补偿和特征提取部分都在低分辨率空间进行,仅在最后一层重建高分辨率图像,算法的运算速度快。实验结果表明,本文算法重建图像的PSNR值和SSIM值超越 VSRnet(Video Super-Resolution Networks)和 VESPCN(Video Efficient Sub-Pixel Convolutional Network)这两类基于二维卷积神经网的视频超分辨率重建算法,与使用 ConvLSTM(Convolutional Long-Short Term Memory network)的DF(Detail Fusion)算法接近,但本文算法速度比DF算法提高超过10倍。从主观视觉效果上,本文算法相比以上算法在高倍率放大时能够更准确地保持重建图像的结构信息。
其他文献
本文以来源于鳞翅目凤蝶科(Papilionidae)的柑橘凤蝶Papilio xuthus新孵幼虫细胞系RIRI-PX1作为试验材料,采用半固体显微操作法对其进行单细胞克隆,并测定克隆株外源基因表达
能源危机和环境问题是决定人类可持续发展的重要挑战,利用光催化技术开发清洁能源是解决这些问题的重要方案。利用太阳能将地球丰富的H2O和N2转化为O2,H2和NH3,可以将太阳能转化为人类所需要的清洁能源和生产生活必需品。在光催化技术中,半导体光催化剂由于其特殊的性质一直被广泛研究,可以在光催化技术中发挥至关重要的作用。但是可见光利用率低、光生电子和空穴的快速重组以及不利的反向反应等因素影响半导体材料
大庆油田杏北X区块目前已进入高含水期,一类、二类油层水淹程度高,但三类油层的表外储层中还有较大的油气储量未得到有效动用。因此,加强对表外储层动用特征的研究,可为油田精准高效挖潜及剩余储量经济有效动用提供理论基础和实践依据。本文以大庆油田杏北X区萨尔图油层II油组(以下简称SII油组)为例,以高分辨率层序地层学、精细沉积学理论为指导,运用河流三角洲地层精细对比技术对SII油组进行沉积时间单元划分与对
随着信息科学技术的高速发展,人们获取信息的通道变得更加广泛与便捷,用户对市场上的产品或服务的选择掌握了很多的主动权,导致许多企业都面临着用户流失的风险。在互联网、大数据技术还未普及的时期,企业构建用户流失预测模型所使用的数据维度低、结构简单,使用单一简单的模型都能取得不错的预估效果。而对于现在的依托于互联网的在线平台,用户流失预测模型构建的难点主要集中在用户数据维度高、结构复杂、噪声样本多且流失用
随着Web 2.0的技术及社会化媒体平台的迅速成长,社交网络逐渐成为电子商务活动中商家与消费者、商家与商家以及消费者之间进行社会交互、信息分享、资讯传递的不可或缺的平台
药物及个人护理品(PPCPs)是一类新型污染物,被广泛应用于人类和兽类药物、农业及水产养殖业,主要包括抗生素、雌激素、人工合成麝香、杀菌消毒剂及清洁剂和消炎镇痛药等。大多数PPCPs具有结构复杂、半衰期短、极性强、难挥发、难降解等特点。常规水处理工艺出水中PPCPs的浓度范围一般介于ng/L-μg/L,但对环境具有长期性、潜在性和灾难性的影响。因此,有必要采用非均相臭氧催化氧化技术对其进行深度处理
目的本课题研究为前瞻性研究,通过对原发性骨量减少且中、低骨折风险的中老年人群在骨质疏松发生早期进行临床上的干预,明确该人群在使用乳双歧杆菌M8菌粉后其骨质方面是否得到真正的改善,为临床上治疗骨代谢疾病提供新的途径,并进一步推进益生菌与人体骨骼健康之间的关系。方法选取2019年05月~2020年03月前来就诊的患者(包括门诊、病房)。对每位被招募患者采用超声骨密度仪进行骨密度(BMD)筛查,并根据筛
藏式宫殿建筑门厅结构通常位于建筑下方的地垄结构中。门厅结构是地垄结构中唯一的木构架承重区域,由于年代久远,木构架出现了较为严重的残损,使得门厅结构的刚度和承载能力进一步下降,残损的继续发展更会威胁到整个建筑的安全。因此木构架承重门厅结构的结构状态及安全性能,成为亟待研究的关键问题。针对上述问题,本文采用现场实测和有限元模型分析相结合的研究方法,对典型藏式宫殿建筑门厅结构的动力特性和力学性能展开研究
发生于2015年的贾敬龙故意杀人案,涉及复杂的民间矛盾,不仅尖锐地折射出目前我国故意杀人罪在死刑适用过程中存在的问题,也给我国死刑制度带来了新的挑战与反思。由于各方面综合原因,我国现阶段尚不具备废除死刑的客观条件,因此如何从实质上规范死刑的适用标准就成为了司法实践中必然要解决的重大问题。轰动社会各界的贾敬龙杀人案,再一次将死刑适用问题推到风口浪尖。案发后,法院最终审理结果一时间引发法学理论界及社会
某化纤厂搬迁后遗留的砷、多环芳烃污染场地亟待修复。对该场地进行污染状况调查,分析出目前场地污染现状。并对砷和多环芳烃污染土壤进行修复实验,筛选出适用且性价比高的修复剂,分别设计出施工技术路线。最后跟进工程施工过程,并对修复后场地土壤进行检测分析,主要研究结果如下:(1)根据场地污染状况分析得:砷污染区域场地土壤中砷的含量在63.11-673.08mg/kg之间,超出质量目标(20mg/kg)的3.