【摘 要】
:
随着信息融合技术的发展,传感器的协同工作应用愈发广泛,红外与可见光图像的融合也是多传感器技术的一部分。图像融合技术就是将来自不同传感器的两张或两张以上的图像进行融合,增加图像信息中的完整度,从而让观察者得到更多的视觉信息。图像融合在医学图像、军用场景、遥感图像和机器视觉等方面得到了广泛地应用。本文将深度学习应用在红外和可见光图像融合汇总,提出了三种红外与可见光图像融合方法。首先,研究了基于深度学习
论文部分内容阅读
随着信息融合技术的发展,传感器的协同工作应用愈发广泛,红外与可见光图像的融合也是多传感器技术的一部分。图像融合技术就是将来自不同传感器的两张或两张以上的图像进行融合,增加图像信息中的完整度,从而让观察者得到更多的视觉信息。图像融合在医学图像、军用场景、遥感图像和机器视觉等方面得到了广泛地应用。本文将深度学习应用在红外和可见光图像融合汇总,提出了三种红外与可见光图像融合方法。首先,研究了基于深度学习的红外和可见光图像的融合算法流程。对图像进行去噪、增强、配准等方面的工作,对深度学习模型进行训练,然后利用本文的算法对红外与可见光图像进行融合,再利用客观评价参数对融合后的图像进行客观评价。其次,研究了基于密集卷积神经网络和视觉显著性的红外与可见光融合方法。分别将红外与可见光源图像进行分解得到低频与高频部分。利用视觉显著性检测提取红外图像的显著图,对红外图像特征进行增强,将红外图像的显著图与红外与可见光图像的低频部分融合得到低频部分融合图像。图像的高频部分在融合的过程中易丢失信息,因此利用深度学习中的密集卷积神经网络对图像的高频部分进行特征的深度处理,然后再用最大融合策略融合高频部分,最后对低频与高频部分融合图像进行重构得到最终的融合图像。再次,研究了基于尺度边缘保护与密集卷积神经网络的图像融合。利用尺度感知边缘保护滤波器迭代红外和可见光图像,4次迭代后得到了4张图像,得到的4张图像包含了不同的图像特征。然后将利用高斯滤波器进行处理第4张图像,得到包含较多特征的图像,这里将之称为基础层图像,再对基础层图像进行融合。再将基础层图像与4层滤波图像利用训练好的密集卷积神经网络进行融合,对融合得到的图像进行信息差计算,这些信息差就是图像的边缘信息,最后将计算得到的细节信息与基础层的融合图像进行融合得到最后的融合图像。最后,研究了基于DPN网络的红外与可见光图像融合方法。基于双路径网络对图像进行融合,利用非下采样剪切波对图像进行分解,对于分解得到的图像得到的低频部分利用向导滤波器改进的拉普拉斯能量和取大的融合策略进行融合,高频部分利用双路径网络融合规则进行融合。实验结果表明,相较于红外与可见光图像的传统融合方法,本文提出的三种融合算法得到的融合图像得到了很好地效果,表明了深度学习算法在红外与可见光图像融合上的优越性能。
其他文献
3D人体姿态估计是在计算机视觉任务中最热门的研究领域之一,通过利用图像信息或视频信息来估计其中的人体关节点位置,并构成完整的人体姿态。随着科技水平的提高,对于人机交互的要求越来越高,可以产生图像信息的智能设备逐渐引入到人们日常生活中。所以,3D人体姿态估计任务具有很高的研究价值。近年来,深度神经网络在计算机视觉任务中有很多成功应用,其也成为了3D人体姿态估计任务的最佳选择。在3D人体姿态估计的研究
本文针对自然场景下的数字字符检测与识别问题,结合计算机视觉相关技术,将检测与识别问题分为区域提取和识别两个过程。具体的工作包含以下几个方面。将无监督特征表达用于自然场景下的数字字符检测问题。选取了K-means与Bo F无监督特征表达用于数字字符检测问题,设计了神经网络结构作为字符区域的判别器。通过滑动窗口法去判别并标记字符区域,最后利用字符区域提取算法筛选出最终的字符区域。通过实验比较了两种无监
近年来,随着互联网和计算机行业的飞速发展,游戏行业发展迅猛。新颖特色的游戏层出不穷,游戏娱乐已经成为现代年轻人生活的必需品,游戏逐渐融入到人们的日常生活当中。随着游戏行业的飞速发展,怎样开发游戏,怎样开发出更好的游戏,已经成为现代游戏开发行业深思的关键。游戏引擎成为了许多企业和开发团队的必要开发工具,其性能强大,方便使用,极大提升了开发者的研发效率,受到了广大游戏开发人员的好评,而Unity3D作
本文研究了选区激光熔化(Selective Laser Melting,SLM)成形TC4钛合金沉积态和热处理态显微组织的特征及其对断裂韧性和疲劳裂纹扩展速率的影响规律。结果表明:(1)沉积态的横截面显微组织表现为大量针状马氏体相α’和β相,纵截面表现为沿成形方向生长的粗大柱状晶,晶内针状马氏体α’相与成形方向呈45°夹角。热处理后,针状α’相转变为板条α相,形成α+β的板条组织。(2)随着热处理
传统搜索引擎是用户检索信息的重要渠道,用户输入问题返回网页集合,需要用户自己快速浏览网页定位到答案的具体位置,整个过程费时费力。基于自然语言处理技术的问答系统是传统搜索引擎的重要改进方向,能够快速获取答案,节省用户时间。和基于知识图谱等结构化问答系统相比,非结构化文本数据规模庞大且较易获取。目前开放式的基于非结构化文本的问答系统技术发展还不够成熟,专业领域的问答系统较少,因此基于限定域非结构化文本
基于计算机视觉的多目标检测技术作为一种智能而便捷的监测手段,在无人驾驶、城市安全等领域中的应用越来越广泛。野外复杂环境下的多目标图像检测技术作为计算机视觉领域中的难题之一,它包含了模式识别、人工智能、数字图像处理等其他关键技术。但是,由于野外环境具有复杂多变、差异性较大、与目标易混淆,目标易受到光照不足、部分遮挡、背景干扰等其他因素影响,造成多目标的检测变得极为困难,算法鲁棒性低。如何充分利用图像
人体行为识别作为计算机视觉和模式识别的热门研究方向,已经在人机交互、智能视频监控、运动分析和医疗辅助等诸多领域得到广泛地应用。人体行为识别是指从视频图像识别人体行为动作同时完成对人体目标的定位跟踪。近年来,大数据技术的发展推动了人体行为识别研究的进步。如何在采集少样本数据集的前提下,迅速获取视频图像中人体行为的信息,使视频数据成为可直接利用的信息资源,仍是需要我们研究的课题。本文在采集少量人体行为
基于机器视觉的公路汽车流量检测技术研究是在不需要人为干预的情况下,从获取初始视频帧开始,移动对象从背景中分割的方法对摄像机拍录的图像序列进行分析,然后到整个视频的汽车计数,实现对场景中汽车的计数,基本得到汽车多少及道路拥堵情况。在视频监控系统的终端实现运动目标检测和计数功能。而本论文主要对两种检测方法进行了理论研究,分别是:(1)帧差法及高斯混合模型法:帧差法是处理视频数据时,从视频中选择代表帧并
超声诊断具有无损、价廉、非电离辐射性、实时等优点,使其成为现代临床医学必不可少的影像诊断技术之一。由于超声成像的相干特性产生的大量噪声,使超声图像存在信噪比低、成像质量差等问题,尤其是掩盖和降低了图像某些细节信息,给之后的图像特征提取和识别,病情诊断及定量分析造成不利的影响。因此,抑制这些噪声,增强图像的细节,改善图像质量是超声图像分析和识别的重要预处理环节,也成为近年来备受研究人员关注的热点问题
虚拟现实技术在科技快速发展的今天,其身影频频出现在各大领域之中,其便利性与高反馈性在科学研究中有着很高的应用价值。将扑翼式飞行器与虚拟现实技术进行结合,使扑翼式飞行器在虚拟世界中进行虚拟仿真和功能实验,是机械领域与当今新兴技术的交叉融合,具有很大的研究意义与应用前景。本文在世界主流开发引擎中进行分析与研究,选择使用Unity3D引擎作为平台并开展了扑翼式飞行器的虚拟仿真与功能算法研究,主要完成的工