论文部分内容阅读
近年来,深度学习飞速发展,成为机器学习领域的重要分支,同时也推动着计算机视觉技术的发展。深层的卷积神经网络(Convolution neural networks,CNN)已被证实是计算机视觉领域的有效方法之一,著名的大规模视觉识别竞赛(Large Scale Visual Recognition Challenge,ILSVRC)即为CNN网络的应用实例。计算机视觉技术可频繁应用于物品检测、视频监控、目标检索等实际应用场景,而图像语义分割则是计算机视觉的基础技术之一。图像语义分割技术帮助计算机理解图像或视频内容,筛选图像语义信息,其准确性直接影响计算机视觉任务的最终结果。可见,好的图像语义分割方法对于计算机完成视觉任务非常重要。传统的图像语义分割方法主要是基于图像本身的特征提取,通过在图像中生成不同的区域,然后在区域内提取特征,最后对区域进行分类合并完成语义分割。方法过程复杂且无法批量实现语义分割任务。随着实际应用需求的不断提高,传统的图像语义分割方法无法适用于实际应用场景,因此,研究者尝试将具有优秀特征提取能力的CNN网络引入图像语义分割任务中。随着遥感技术的发展,人们可获取到的遥感图像越来越多,对于遥感图像的处理工作也越来越复杂。现有的遥感图像处理方法主要依赖于人类的先验知识,需要耗费大量的人工资源标记、识别遥感图像,完成图像预处理工作。基于以上背景,本文提出将深层的CNN网络引入遥感图像的预处理工作,实现基于卷积神经网络的遥感图像语义分割。本文通过修改Alexnet、VGG-16及GoogLeNet这三种深层CNN网络的网络结构构建完全卷积神经网络,实现对遥感图像每个像素点的语义类别划分。首先对遥感图像进行标签图像上色及边缘提取处理;然后采用三种不同的网络训练方案依次对修改后所得的三种完全卷积神经网络进行参数训练;最后通过对比分析网络的目标匹配率及语义分割结果图像,得到最佳的网络训练方案及最佳的遥感图像语义分割模型。根据本文所得实验结果,可以认为将深层的CNN网络应用于实现遥感图像的语义分割任务是可行的。