论文部分内容阅读
图像融合技术是图像处理的一个类别,主要指采用相关算法,将具有不同成像原理或是不同波段的图像信息重新组合成一个新的图像。融合图像的清晰度增加,可理解性增强,更加符合人类视觉以及后续计算机进一步的识别检测等工作。深度学习的网络层次结构多,能用相对简单的形式来描述复杂抽象的函数,以便于学习深层的结构特征。于是,将图像融合与深度学习相结合,通过进一步更深层次的提取图像特征,为后期图像融合的完整度与清晰度提供保证。本文的研究工作主要包括:(1)仔细的对图像融合的相关知识点做了深入的学习,掌握现有方法突出之处与尚存在的缺陷,对几种流行的图像融合算法加以探讨与比较;再者,引入深度学习,介绍其发展历程与目前的进展,将深度学习与浅层结构作对比,突出深度结构的优势;最后总结深度学习的常用模型方法,详细介绍自编码器(Auto Encoder,AE)、稀疏自编码器(Sparse Auto Encoder,SAE)和卷积神经网络(Convolution Neural Network,CNN)的工作原理及训练过程。(2)选用深度学习的一种稀疏自编码模型学习图像特征。首先将几幅原始图像采用滑动窗技术进行分块,然后再组合形成联合矩阵,用稀疏自编码器模型训练出这个权值矩阵和参数矩阵,通过反馈对参数进行微调,可以得到几幅原始图像对应的特征,这些特征都是通过稀疏自动编码器来自动学习到的,再采用最大化选择的方法融合原始图像。通过实验验证,针对神经元数目的不确定性,当隐藏层神经元数目多余输入单元数目时的融合的效果最佳。还讨论了用其他融合方法与此方法比较的差异性。(3)提出一种基于深度自编码卷积神经网络的多聚焦图像融合方法。直接把图像作为特征进行融合会丢失一些诸如边缘等的细节信息,为规避这种风险,采用原始图像进行分离的方法对源图像背景与前景的聚焦和不聚焦部分进行特征分离。通过自编码器对卷积神经网络进行逐层递进训练,完成网络模型的搭建。对于前景聚焦与不聚焦的输出特征采用绝对值最大法进行融合;对于背景的输出特征采用加权平均法加以融合。通过实验验证了算法的可行性与有效性。