【摘 要】
:
在计算机视觉领域中,图像融合是一项重要的处理技术,它旨在将多张输入图像中的显著特征整合到一张便于理解的融合图像中。早期的研究中,研究人员将图像从空域转换到频域,将这些数据在频域融合,再将融合后的数据从频域转换到空域得到融合图像。这种方式不但计算量较大,而且还会造成信息的丢失。因此提出了基于表示学习的融合算法,直接在空域对图像进行融合。这些方法需要大量的手工设计,而为了取得更好的融合结果,特征提取方
论文部分内容阅读
在计算机视觉领域中,图像融合是一项重要的处理技术,它旨在将多张输入图像中的显著特征整合到一张便于理解的融合图像中。早期的研究中,研究人员将图像从空域转换到频域,将这些数据在频域融合,再将融合后的数据从频域转换到空域得到融合图像。这种方式不但计算量较大,而且还会造成信息的丢失。因此提出了基于表示学习的融合算法,直接在空域对图像进行融合。这些方法需要大量的手工设计,而为了取得更好的融合结果,特征提取方式和融合策略也变得越来越复杂。随着深度学习的发展,基于深度学习的图像融合算法在一定程度上缓解了所面临的问题。基于深度学习的算法中,图像的深度特征由训练好的神经网络提取。再将提取到的特征按照制定好的规则进行融合,最后由融合后的特征重构出融合图像。现存的许多基于深度学习的融合算法在提取图像特征时考虑并不充分,提取到的特征包含信息不够全面,直接降低了融合图像的质量。除此以外,许多融合算法虽然提取了图像的多尺度特征,但是并没有考虑不同尺度上特征的区别,对所有特征使用完全相同的融合策略并不合适。因此,本文主要进行基于深度学习的图像融合算法研究,针对上述问题进行改进。本文的主要贡献分为以下几个方面:(1)针对红外与可见光图像融合任务,基于自编码网络的融合算法Nest Fuse有较好的表现。它将鸟巢(nest)结构应用到解码器中,使网络可以充分利用提取到的多尺度深度特征。这种方式虽然在融合图像中保留了更多的信息,但是需要学习的参数量较大,降低了模型的效率。因此提出的一个新的融合算法FPNFuse。该算法在Nest Fuse的网络框架上引入了特征金字塔网络结构对提取到的特征进行增强,使每一层特征都包含丰富的信息。此外,还根据每层特征的特点选择了合适的融合策略,在融合过程中保留更多的信息。实验表明,所提出的算法有效的对Nest Fuse进行改进,取得了更好的融合结果。(2)在FPNFuse的网络框架上,提出了一种方法来增强卷积神经网络对图像的特征提取与重构能力。具体来说,在训练阶段将源图像进行直方图均衡化改变其像素分布,使训练出的深度网络对特征提取与重构更加具有鲁棒性。除此以外,还改进了特征提取阶段的编码块,使其提取到更加丰富的特征。该融合算法由三部分组成:编码器、融合策略和解码器。首先,由改进后的编码器从源图像中提取多尺度特征。其次,这些特征按照融合策略在对应的尺度上分别进行融合。最后,融合后的深度特征由解码器重构为信息丰富的融合图像。实验结果表明,所提出的融合方法在主观和客观评估中都取得了较好的表现。(3)在基于深度学习的图像融合方法中,多尺度分解是一种提取不同尺度特征的重要方式。针对传统多尺度分解方法里尺度设置粗糙的问题,提出了一种基于八度(Octave)卷积的图像融合算法。八度卷积让每一个尺度上提取到的深度特征进一步细分出低频、次低频和高频特征,再针对每一尺度上不同频率的特征采用不同的融合方法。除此以外,高层特征也被加到低层特征上来进行不同尺度之间的特征强化。提出的融合算法由四部分组成:编码器、特征增强、融合策略和解码器。首先,算法使用改进后的编码器获取源图像多尺度上的低频、次低频和高频特征。这些特征会被从顶层到底层进行强化。然后,按照对应的融合策略将特征融合。最后,融合后的深度特征由解码器重构出融合图像,其中包含丰富的信息。实验结果表明,所提出的融合方法可以有效的处理红外与可见光图像融合任务。
其他文献
作为图像理解和计算机视觉的基石,目标检测是解决图像分割、场景理解、目标追踪等任务的基础。现在目标检测算法种类繁多,根据是否包含区域建议网络可以分为两阶段目标检测算法和单阶段目标检测算法。根据是否具有锚框又分为基于锚框的目标检测算法和无锚目标检测算法。虽然现在的目标检测算法在精度和速度上都取得极大提升,但是由于视角的多样性,多尺度变化,遮挡和光照强度等复杂场景的影响,以及模型的泛化能力不足等问题使得
阿尔茨海默症(Alzheimer’s Disease,AD)是一种不可逆的大脑神经退行性疾病,一旦发病就没有治愈的可能。随着我国老龄化程度的加深,阿尔茨海默症患者越来越多,给家庭和社会都带来了沉重的负担。日渐增多的患者,极大地增加了相关领域医生的工作量,而计算机技术飞速发展,使之在医学领域有广泛的应用。近年来深度学习技术蓬勃发展,使得深度学习技术在医疗图像的分类、分割等领域有了广泛的应用。因此利用
近年来,随着深度学习的迅速发展,伴随着计算机硬件性能的快速提升,行人重识别在智能监控、智能安保领域扮演着越来越重要的角色,吸引了研究者的广泛关注。相较于过去基于手工设计特征的行人重识别方法,基于卷积神经网络的行人重识别方法从大规模行人图像数据中挖掘信息,具备更好的特征表示能力。很多最近的研究在这一领域取得了一定的成果,但仍存在很多问题需要解决。在行人重识别研究中,按监督级别的不同,可以大致划分为有
准确和鲁棒的视觉目标跟踪是计算机视觉领域中最具挑战性的基础任务之一,在智慧安防、自动驾驶和机器视觉等场景中有着非常广泛的应用。在只给定初始目标状态的情况下,目标跟踪旨在实现对图像序列中后续目标轨迹和状态的准确估计,对目标跟踪算法提出了很高的要求。经过国内外学者多年的研究,目标跟踪方法取得了很大的进展。尤其是近些年来,基于孪生网络的算法提供了全新的跟踪范式,得到了广泛的关注,极大地推动了目标跟踪领域
人群计数旨在利用给定场景中的人群特征估计人数和密度分布,其作为一项视频图像处理技术在当今很多行业中都发挥着重要的作用。尤其随着世界人口增长和城市化进程发展,人群计数的应用场景也越来越多,对社会安全和人群控制管理有着举足轻重的意义。得益于计算机硬件不断提升和深度学习飞速发展,近年来人群计数的研究取得了相当大的进展。本文针对不同复杂场景具体分析了现阶段人群计数存在的困难和挑战,主要研究和解决了场景中存
高光谱图像是一种复合信息图像数据,同时包含了空间信息与光谱信息。与自然图像相比,高光谱图像拥有更为丰富的光谱特征。因此,高光谱遥感极具应用价值,在地质探测、环境监测、军事监视和农业领域内都有广泛的应用。近年来,随着光学传感器的发展,高光谱图像的成像质量越来越高,合理的分析高光谱图像数据可以准确的区分地物覆盖类别,高光谱图像分类也因此成为高光谱遥感中最为重要的应用之一。目前,深度学习凭借着强大的特征
细粒度图像识别是对大类下的子类图像进行更为精细的划分,比如区分一只狗是哈士奇还是萨摩耶。细粒度图像识别的挑战在于其不同类之间的差异较小,相同类别有时差异较大等。基于细粒度图像中固有的特性,如判别性区域较小、图像特征差异化程度不够等,以往的识别方法存在着有区分度的区域信息提取单一和特征不够丰富等问题,使得此任务还存在一些改进空间。针对这些瓶颈,本文设计了多个以深度学习为基础的细粒度图像识别方法,在弱
面对当今飞速变化的全球社会,作为未来发展中坚力量的学生正不容选择地被卷入全球化进程之中,“全球胜任力”理念应运而生。英语作为一门非母语的国际通用语言学科,对全球胜任力的培养无疑具有特殊意义。基于此,本研究按照从定义到文本再到实践的逻辑顺序,致力于解决全球胜任力的概念界定、本土化标准构建与在我国高中英语学科教学中的实践路径这三个问题,以达到促成全球胜任力教育融入英语学科教学实践中的目的。本研究的研究
在“互联网+教育”时代,数学教师的教学需要融合新理念、新技术,这对数学教师的教学能力提出了新的要求。可视化学习技术以其独特的形象化的表征方式,能够帮助教师和学生对数学知识的理解形成更好的认知效果,对于促进教师教学观念的转变,教师教学方式的改变有重要作用。然而在缺乏专业理论指导的情况下,数学教师难以将可视化学习技术整合到数学教学中,因此难以达到教学创新的目的。针对这一现实问题,本研究试图采用“教师-
行为识别是计算机视觉领域一项很重要的组成部分和热点的研究课题。因为人们能够利用行为动作来处理事务和传达情感,所以行为识别技术也能够在不同领域中进行广泛使用,比如安全监控、人机交互、视频分类等。由于骨架数据能够更有力地对抗更复杂背景下的视点、运动速率的变换,基于骨架数据的行为识别技术近年来得到了快速的发展。在此基础上,图卷积网络因其图拓扑结构能够更有效地建模骨架数据间的依赖关系,在骨架行为识别任务中