论文部分内容阅读
昆虫图像识别是昆虫识别领域的一个分支,是进行生物研究、病虫害监测和检测的关键技术之一。昆虫图像识别依赖于图像中目标特征的提取与抽象。传统昆虫图像识别方法的预处理过程复杂,需要根据具体的任务需求设计出相应的特征提取算法,识别精度较低。本文采用深度学习方法进行昆虫图像识别,让识别模型在具体任务中通过学习的方式来逼近一种恰当的、高复杂度的特征提取算法,从而提高识别模型的性能。本文的研究按照样本收集、模型选择、模型和训练算法改进、分类识别、目标检测的顺序开展,以理论分析与实验对比相结合的方式进行研究。主要的工作和研究成果如下:(1)收集并标注了包含10类外形近似的天牛科昆虫,共2782幅自然背景的昆虫图像样本集。采用部分图像空间变换算法对原始样本集进行了扩充,扩充后的样本容量达到了12474。该样本集具有一定的通用性,可被用于昆虫识别和图像识别相关技术的研究中。(2)基于昆虫图像样本集,通过理论分析和实验比较,选择了DenseNet作为本文昆虫图像分类识别研究的基础网络模型,并设计了一种改进方案:UDenseNet。改进模型加强了特征传递和复用,使用了较小的网络生长率以减少网络参数、减轻网络模型在昆虫图像样本集上的过拟合现象。改进模型减少了大约2/3的卷积层参数,并使得昆虫图像分类识别准确率提升了约0.5%。此外,设计了一种混合池化的方法,通过参数的学习,将最大值池化与均值池化特征加权混合。使用混合池化的DenseNet和UDenseNet在昆虫图像样本集上均取得了一定的识别精度提升。(3)基于随机梯度下降算法,提出了一种自适应学习率下降算法。该算法通过探测以当前学习率进行训练的瓶颈,达到自动进行学习率下降的目的。本文实验表明,使用该算法进行训练能够避免具体任务中反复调整学习率下降步长的过程,并且获得相对较好的泛化性能。(4)使用改进的训练算法进行了DenseNet的微调训练和DenseNet、UDenseNet的直接训练,并以训练好的模型进行了昆虫图像分类识别。识别结果使用了多重裁剪的策略进行加强。其中微调训练的DenseNet模型在包含600幅昆虫图像的扩充测试样本集上的测试准确率达到99.83%。另外,为了解决实际应用中一幅图像包含多个种类的检测目标的情形,形成完整的昆虫图像识别解决方案,使用目标检测框架R-FCN在人工标注的昆虫图像样本集上进行了模型训练和目标检测。采用改进训练算法训练的模型在验证样本集上达到了90.51%的mAP。