基于注意力卷积神经网络的图像超分辨技术研究

来源 :华东交通大学 | 被引量 : 0次 | 上传用户:susan6918
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图像超分辨作为计算机软件层面的算法,其目的是对图像中的模糊部分进行处理,从而从低分辨率图像中恢复细节信息,重建高分辨率图像。当前,基于卷积神经网络的图像超分辨技术通过对低分辨率图像特征的自主学习,重建的高分辨率图像获得了显著的突破。因此,该类方法受到了国内外学者的广泛关注,并成为现今图像超分辨领域的研究焦点。但图像超分辨是一个高度不适定的问题,同样的一幅高分辨率图像可以通过不同程度的低分辨率图像所重建。现有的基于卷积网络的超分辨方法仍然存在一些很大程度上没有解决的关键问题:(1)没有充分挖掘可用信息的深度网络具有非常大的计算复杂度,但并不能总是保证高质量的图像。(2)在图像特征的学习中没有对低频信息和高频信息加以区分,忽视了对跨通道特征信息的挖掘,导致重建的图像效果不佳。本文针对以上问题展开研究,提出了一些针对性的解决方案。本文的研究主要有以下内容:首先,引入注意力机制指导已有的处理资源的分配,使之偏向于信息最丰富的部分。它可以为每个特征图赋予权重关注,通过模型的训练来自适应重塑特征图之间的相互依赖性,从而增加模型对图像特征的鉴别性能力。其次,提出了一种基于分层的注意力级联网络模型用于图像超分辨。由于图像中输入的低分辨图像和重建的高分辨图像之间存在很强的相关性,充分利用低分辨图像中的可用信息是非常重要的。因此在模型的整体架构上,设计了层次性的级联群组用以关注局部和全局的特征信息,并建立一个深层的可训练网络。而后,设计了注意力稠密模块对层次的特征进行处理和学习,以增强网络对特征信息的辨识能力。相较于传统的插值方法和卷积网络的超分辨方法,该模型在测试数据集上拥有更好的图像超分辨重建表现。最后,提出了一种基于多通道的残差注意力网络模型用于图像超分辨。该结构通过对低频和高频特征信息的多源复用来获得更丰富的有效信息,并通过对跨通道特征信息的融合处理以获得最佳的重建效果。其中最关键的两个成分为多源残差群组和多通道注意力模块。前者用于捕获远程空间的全局低频信息和局部网络的高频特征信息,后者将多种不同通道的特征融合在一起,并利用注意力机制来进行自适应重塑,使得信道特征具有更强的判别性表示。通过在数据集上的实验验证了本文提出的模型结构的有效性,并通过与以往的基于卷积神经网络的先进方法对比,展示了本文方法更好的图像超分辨重建效果。
其他文献
近年来,随着电子计算机系统的不断发展,在处理一些大数据时,出现了能耗高、并行处理能力不足以及计算率低的问题。而三值光学计算机具有能耗低、巨位数可并行运算以及可按位重构的特点,这些特点使得它在处理大规模数据的计算问题时具有一定的优势。基于三值光学计算机具有以上的这些优势,本文将研究采用三值光学计算机求解大规模的最短路径问题。本文的研究内容包括:利用三值光学计算机数据位易扩展和巨位数并行的特点提出全并
人群流量的准确预测对于政府部门有效且合理的管理交通资源、提高群众出行体验、改善道路交通安全环境等来说具有重要意义。然而,由于人群流量数据具有特殊性,它是一种复杂的时空数据,建立人群流量预测模型时必须同时考虑其时间依赖关系和空间依赖关系。此外,人群流量还受事件、天气等外部因素的影响。因此,想要准确的预测人群流量绝非易事。传统人群流量预测方法的研究对象通常是单一区域的人群流动模式,而这些方法只考虑人群
学位
学位
随着互联网技术和社交网络的快速发展,各种网络平台生成了大量用户针对不同领域的评论文本。这些文本包含着丰富的情感倾向,从中可以发掘互联网用户或消费者对于该事物态度,这些信息无论对个人用户、商家或国家监管部门都有重大意义。在大数据时代,随着技术和硬件设施的不断升级,各种平台的评论文本数据量都以爆炸性增长,只依赖统计学方法已经无法满足日益增长的评论文本情感分析需求,所以如何通过人工智能技术精准高效挖掘评
铁路运输作为一种高效的运输方式,在带动经济发展的同时,给人们的生活带来了极大的便利。相关统计数据显示,在铁路运营过程中,钢轨表面伤损恶化造成的列车运行事故占比较高。因此,对钢轨表面伤损进行准确的检测,具有十分重要的实际应用价值及研究意义。钢轨表面伤损的检测方法可以划分为物理检测方法、基于机器视觉的检测方法两种。其中,物理检测方法操作困难且需要大量人为干预,检测结果具有一定主观性,无法保持检测精度的
作为深度学习主流算法之一,循环神经网络(Recurrent Neural Network,RNN)对处理时序信息具有更敏感更出色的能力。因此,循环神经网络被广泛使用于电信、电力、人机交互等许多传统以及新兴智能领域。然而,在许多应用场景中,资源有限的终端设备难以应用循环神经网络。这主要的原因在于神经网络结构具有较高的计算复杂度,并且需要大量的计算资源以及存储资源。为了解决此问题,研究者提出了许多合理
伴随着资源枯竭和环境污染等问题日益突出,新能源汽车逐渐活跃于大众视野。与传统燃油汽车的驱动装置不同,新能源汽车采用电机集成驱动,电机噪声远小于内燃机噪声,但由于缺失了发动机噪声的掩蔽效应,传动系统产生的振动噪声显得更为突出。为了追求更高的行驶速度,电机高转速输入导致对齿轮传动系统的设计也更加严格,多级齿轮传动系统的振动和噪声成为关注的重点。本文以某款新能源汽车的多级齿轮传动系统为研究对象,以改善多
学位
在生活质量提高的今天,人们对高清晰度图像的需求变高,之前的超分辨率重构方法已不能满足人们对于高质量图像的需求。所以基于深度学习的超分辨率(Super-Resolution,SR)技术被提出来提高图像的质量以满足多领域各人群的需求,其应用价值极为广泛,例如卫星监测、医疗军事、数字媒体,遥感等。近年来,深度学习技术不断发展,卷积神经网络(CNN)在SR重建方面取得很大成功。本文重点研究CNN的单幅图像