论文部分内容阅读
超分辨率重建算法旨在将低分辨率的图像/视频通过一系列的处理重建为高分辨率的图像/视频,该技术具有重要的现实意义,广泛应用在医疗、通信和遥感等领域。本文对基于深度学习方法的图像及视频超分辨率重建算法进行了深入研究,主要研究成果如下:
(1)针对主流算法中特征映射主体部分感受野单一的问题,提出了基于多尺度结构信息融合堆叠的图像超分辨率算法。对多尺度信息建模,设计了整体结构呈编解码结构的结构信息金字塔模块,用于提取和融合图像多尺度结构信息。在编码阶段设计的密集连接注意力模块展示出特征提取的高效性和参数的轻量性。通过实验表明,该算法与主流同类算法进行对比,在客观指标上和主观感受上均有较大提升。
(2)针对主流算法中网络结构越来越深且单个网络只能完成单个倍数放大任务,因此提出了一个轻量的基于递归金字塔的多任务图像超分辨率算法。网络以设计的递归金字塔为主体实现2n倍数的超分多任务;采用多任务学习的训练方法,正向促进每个子任务的重建精度;以自适应融合的方式改进密集连接注意力模块,添加少量的参数达到重建效果的进一步提升。该算法与主流算法在PSNR、SSIM、参数量、运算量上进行全面的对比,验证了该算法在多任务的有效性和参数运算量的轻量性,在参数量相当的情况下该算法的客观指标和主观感受更好。
(3)针对视频相邻帧特征不齐和时间冗余信息没有被充分利用的问题,提出了基于非局部可变形卷积的视频超分辨率算法。在图像超分辨率网络的基础上增加了相邻帧对齐模块和相邻帧融合模块。在对齐模块中使用可变形卷积对特征进行不规则采样,从而到达特征层面的隐式对齐,使用非局部模块打破普通卷积的局部限制,以计算自相关矩阵的方式为特征增加了全局信息,从而使对齐效果更佳。在融合模块中使用3D卷积替换2D卷积,充分利用了帧间的时序信息,使特征融合效果更好。该算法与主流的图像和视频超分算法进行了定量定性的对比,实验结果表明该算法在客观指标和主观视觉感受上均有较大提升。
(1)针对主流算法中特征映射主体部分感受野单一的问题,提出了基于多尺度结构信息融合堆叠的图像超分辨率算法。对多尺度信息建模,设计了整体结构呈编解码结构的结构信息金字塔模块,用于提取和融合图像多尺度结构信息。在编码阶段设计的密集连接注意力模块展示出特征提取的高效性和参数的轻量性。通过实验表明,该算法与主流同类算法进行对比,在客观指标上和主观感受上均有较大提升。
(2)针对主流算法中网络结构越来越深且单个网络只能完成单个倍数放大任务,因此提出了一个轻量的基于递归金字塔的多任务图像超分辨率算法。网络以设计的递归金字塔为主体实现2n倍数的超分多任务;采用多任务学习的训练方法,正向促进每个子任务的重建精度;以自适应融合的方式改进密集连接注意力模块,添加少量的参数达到重建效果的进一步提升。该算法与主流算法在PSNR、SSIM、参数量、运算量上进行全面的对比,验证了该算法在多任务的有效性和参数运算量的轻量性,在参数量相当的情况下该算法的客观指标和主观感受更好。
(3)针对视频相邻帧特征不齐和时间冗余信息没有被充分利用的问题,提出了基于非局部可变形卷积的视频超分辨率算法。在图像超分辨率网络的基础上增加了相邻帧对齐模块和相邻帧融合模块。在对齐模块中使用可变形卷积对特征进行不规则采样,从而到达特征层面的隐式对齐,使用非局部模块打破普通卷积的局部限制,以计算自相关矩阵的方式为特征增加了全局信息,从而使对齐效果更佳。在融合模块中使用3D卷积替换2D卷积,充分利用了帧间的时序信息,使特征融合效果更好。该算法与主流的图像和视频超分算法进行了定量定性的对比,实验结果表明该算法在客观指标和主观视觉感受上均有较大提升。