论文部分内容阅读
近年来深度神经网络以其强大的特征提取和表达能力,在图像分类及识别、自然语言处理等研究领域取得了显著成效。其中,卷积神经网络具有局部感受野、共享权值等特点,这些结构特点不仅降低了提取图像特征的计算复杂度,而且可以有效地将图像的局部特征通过一定规则组合成能够代表图像对象的整体特征。但是,目前卷积神经网络在遥感领域的应用还存在不少的瓶颈。主要原因是高分辨率卫星遥感图像包含的信息量大,图像复杂性高,对特征提取造成了很大障碍。针对这个问题,本文利用大量遥感数据,设计了适用于高分遥感图像目标特征提取的卷积神经网络结构,并将提取出的特征用于遥感图像分类、检测及标注。本文首先介绍了神经网络的基本结构,并以卷积神经网络为例,介绍了神经网络的学习算法,同时给出了循环神经网络的模型。之后,研究了不同卷积神经网络结构的特征提取能力。使用梯度学习算法在MNIST手写字符集上训练卷积神经网络模型,分析网络结构中的卷积核以及网络深度等因素对于图像特征提取的影响。实验结果表明网络层数较深,卷积核尺寸较小、数量较多,池化尺度较小的网络结构具有较好的特征提取能力和分类效果,可以被用于高分遥感图像的特征提取。针对遥感图像复杂的特点,通过分析特征提取,提出适用于高分遥感图像目标检测的联合层深度卷积神经网络模型。遥感图像中目标检测困难,背景复杂而目标相对较小,特征不够明显。使用联合特征更容易探测到遥感图像中的局部特征,利用提取的特征训练分类器并用于车辆检测。实验表明联合层深度卷积神经网络在车辆检测任务上相比传统卷积神经网络方法准确率和召回率分别提升了16%和6%,与传统人工特征方法相比效果更好,说明提出的模型对于高分遥感图像中较小目标的特征学习很有效。最后,结合卷积神经网络和循环神经网络训练多模态语言模型解决高分遥感图像的语义标注问题。在遥感数据集中加入自然数据集,增强泛化性能。在训练阶段,将卷积神经网络作为编码器提取图像特征,将图像特征和对应语句的词向量映射到相同维度,使用梯度下降算法训练标注模型,通过BLEU自动标准评估标注语句;在测试阶段,输入图像到多模态循环神经网络模型,生成描述语句。实验结果表明多模态循环神经网络模型在遥感图像标注上取得了一定的效果,不过受到数据集规模限制,可以增加遥感语义数据来改善描述的准确性。