论文部分内容阅读
我国是一个农业大国,农业经济关系重大。帮助农业机械更好的理解周围环境,对于推动精细农业发展有着至关重要的作用,而场景理解中的关键研究内容就是语义分割。本文以农田场景图像为研究对象,获取、增强和处理了农田图像数据集。根据农田场景易受环境影响的实际情况,通过全卷积网络结合条件随机场,并加入边缘区域约束的方式,实现了农田场景下的图像语义分割。本文的主要研究内容及结论有:(1)农田图像语义分割的数据集获取。针对现有数据集缺少完整农田样本的情况,通过参考现有成熟的常用图像语义分割数据集,首先设计了农田场景下的拍摄场所、时间、方法和对象,完成了图像的获取工作。然后根据获取的农田场景图像的信息内容,通过翻转变换和水平方向上的平移变换对数据集进行加强,使图像数量变为原来的8倍,以防止过拟合的发生。并在调整尺寸和人工标注后,建立了较为完整的农田场景下用于图像语义分割的数据集。(2)基于全卷积网络(FCN)的农田语义分割模型。农田场景图像数据集构建完成后,在caffe框架下首先基于VGG-16网络结构的初始FCN模型,完成模型的训练和测试操作,然后根据图像语义分割准确度的评判标准,对FCN-32s、FCN-16s和FCN-8s三种不同跳跃结构产生的语义分割结果做出判断与分析。最终确定了在农田场景下分割效果较好的FCN-8s作为后续工作的研究基础。(3)结合CRF-RNN的农田语义分割模型及优化。针对FCN模型分割不够细致和像素之间缺乏联系的问题,选择条件随机场-循环神经网络(CRF-RNN)以加强农田图像像素间的上下文信息,并结合农田的实际场景,通过区域边缘约束的方式对现有模型做出改进,从而使PA值达到90.05%,MIoU值提高至73.45%。最后,分别从图像语义分割准确度、光照强度和作物密度三个方面对实验结果做出评判和分析,确定了农田模型的有效性和较强适用性。综上所述,本文以获取的农田图像数据集为研究基础,基本实现了农田场景下的图像语义分割,并验证了其有效性和适用性,为农业机械感知周围环境的实现提供了一定的理论基础。