论文部分内容阅读
计算机视觉一直是计算机领域的研究热点,随着深度学习技术的出现,计算机视觉技术取得了突破性的进展,尤其是在多种复杂图像解译领域。其中基于深度学习的多种遥感图像分类技术被广泛应用于环境监测、城市规划、灾害控制、农业领域等。而基于深度学习的遥感图像目标检测技术则广泛的应用于大场景内地物识别,例如飞机、轮船、车辆、各种功能型建筑的识别等。除此之外,基于深度学习的自然图像目标检测也在国民生活中得到了广泛的应用,例如行人检测、道路监控、无人驾驶等。为了更好的对复杂图像进行解译,本文通过增强多元化的局部空间信息对多种类型图像的分类和目标检测问题进行了研究。本文为了充分利用图像中的空间信息,在多光谱和高光谱图像分类的基础上对多种局部区域的空间信息表示增强方式做了研究。为了能够在任意大小场景中实现多类目标检测,本文在多尺度模型和全卷积模型的基础上研究了光学遥感图像目标检测。本论文为了有效地提高目标检测精度,对基于目标级特征和目标内部件级特征融合的目标检测算法做了研究。全文主要工作内容如下:1)提出一种基于超像素多重局部区域的卷积神经网络模型用于多光谱图像分类。为了减少卷积神经网络输入数据的数量,本文利用扩展的简单线性迭代聚类算法分割多光谱图像生成超像素来代替像素作为图像分类的基本单元。为了充分利用每个超像素的空间光谱信息以及周围的环境信息,本文设计了基于超像素的多重局部区域联合表示策略。然后搭建基于超像素的多重局部卷积网络模型来提取联合特征表示,并通过softmax分类器实现分类。最终为了减少超像素内和超像素之间的误差,本文结合了多种信息包括细节信息和语义关系信息用于提升分类结果。基于多组多光谱图像的实验表明本文提出的算法是有效的。2)提出了一种基于增强空间表示的多阶段空谱融合网络用于高光谱图像分类。首先,引入由多邻域表示策略和变距离下采样策略组成的增强空间表示模块,并用来提取更加稳定的空间信息和更加丰富的细节信息。然后,通过设计的空间子网络和光谱子网络用于提取空谱特征。在特征融合部分,本文设计了名为多阶段空谱融合网络的更为有效的融合模型,其中包含了中级特征融合、高级特征融合、语义级空谱协同约束和决策级融合,通过该模型融合空谱信息并得到最终的分类结果。基于多组高光谱图像的实验结果表明该算法是有效的。3)提出了一种多尺度图像块级全卷积网络用于光学遥感图像目标检测任务。首先,算法中使用的训练数据只包含了类别标记而没有边框标记,这样可以在训练阶段减少人工标注。然后,利用设计的多尺度网络提取基于多尺度的高级特征用于更好的表示各种各样的目标。模型中的图像块级全卷积网络有助于提高计算效率,并且可以直接检测任意大小的输入图像,其中包含大型场景遥感图像。在测试阶段,大场景图像可以直接输入本文设计的网路模型,并直接生成检测结果,最后通过提出的边框修正策略和局部重识别策略提升检测结果。基于公开光学遥感数据和多组大场景的机场图像的实验结果表明该算法是有效的。4)提出一种基于生成式对抗网络模型的弱监督学习框架并结合多尺度检测网络用于超高分辨光学遥感图像目标检测任务。首先,利用原始数据训练无监督生成式对抗网络作为检测网络的预训练模型,这样可以减少算法在预训练过程中对额外标记数据的需求。然后,将基于生成式对抗网络中判别网络的弱监督学习框架用来自主挖掘训练数据,以减少人工消耗。通过设计的包含多尺度结构和全卷积过程的多尺度检测网络可以高效的检测多种目标,即使是在非常大的场景。此外,通过权重共享来优化多尺度检测网络,这样可以减少参数的数量并提高显卡应用效率。最后,通过局部重识别策略提升初始检测结果,并得到更加准确的检测结果。基于公开光学遥感数据和大场景的机场图像的实验结果表明该算法是有效的。5)提出了一个部件信息增强网络的自然图像目标检测算法,其中包含了关键部件增强模型和部件关系模型。在本文的提出的检测算法中,不但考虑了目标级的信息,而且充分利用了目标的部件信息,其中包括关键部件的信息,关键部件和其它部件之间的关系信息。首先,将场景级的视觉注意模型扩展成目标级的视觉注意模型用来生成目标各部件的重要性掩膜,通过重要性掩膜和目标的特征图可以得到关键部件增强信息。然后,设计了部件关系模型,用来提取部件之间的关系信息,其中包含了关键部件和其它部件之间的空间关系信息和视觉关系信息。最终,将目标级的基本信息和关键部件增强信息,以及部件关系信息相结合用于增强目标检测结果。通过公开的目标检测数据集验证提出的部件信息能够增强目标检测结果。