论文部分内容阅读
建筑物是多光谱图像重要的地物,如何能够准确地识别出建筑物是目前的研究热点。深度学习技术是人工智能的一大分支,目前已有较多的目标识别方法中使用了深度学习技术,且识别效果较好。但深度学习在多光谱图像建筑物识别方向仍存在一些不足之处,本文主要针对两种深度神经网络的模型及其识别原理进行了研究,先提出了一种基于深度置信网络的多种特征相结合的建筑物识别方法,研究了人工提取特征和深度置信网络提取特征相结合的建筑物识别方法,再提出了一种基于改进的全卷积神经网络的建筑物识别方法,研究了神经网络自提取特征的建筑物识别方法。多光谱图像中的建筑物存在大量的纹理、轮廓和颜色等信息,有效的利用这些信息并设计合理的特征是保证能够准确识别建筑物的前提。本文首先提取了建筑物的Gabor-HoG特征,该特征融合了图像的纹理特征和边缘特征,将提取到的特征进行融合,输入至深度置信网络中提取更高层的特征。将这些特征输入到条件随机场中提取建筑物的上下文特征,再由条件随机场模型根据概率推断出建筑物目标,实现了建筑物的像素级识别。主要解决了经典深度置信网络识别方法忽略目标上下文信息和低层特征的提取的问题。本文还基于深度置信网络与条件随机场的识别方法、基于Gabor-HoG与深度置信网络的评价方法和基于Gabor-HoG与条件随机场的评价方法进行了对比实验,实验结果验证了本文方法能更准确地识别建筑物。卷积神经网络可以通过对卷积核的训练实现对目标的自动特征提取和识别。本文提出了一种针对于多光谱图像中建筑物特性的基于多尺度与旋转扩充训练相结合的全卷积神经网络模型的建筑物识别方法。与基于深度置信网络的多种特征相结合的建筑物识别方法相比,本方法的特征是通过BP算法训练后的卷积核自动提出的,不需要人工设计特征,提取到的特征种类较丰富。该方法先对建筑物进行尺度变换和旋转变换,通过4组并行的卷积核提取其多尺度特征并融合,串行地提取建筑物的更高层特征,最后通过Softmax分类器分类。该方法主要解决了经典全卷积神经网络忽视了尺度不同带来的识别效果的差异,以及由于建筑物朝向不同造成识别降低的问题。本文与J Long等提出的全卷积神经网络模型、B Hariharan等提出的一种改进的全卷积神经网络模型和Shaoqing Ren等提出的一种Faster R-CNN模型进行了对比,实验结果验证了本文方法的有效性。