论文部分内容阅读
近年来,深度学习发展迅猛,在计算机视觉领域的诸多研究方向上,如图像分类、图像分割等都取得了很多成果,这些成果将会为依赖于视觉主观判别的农业信息化领域带来重大的突破。以果实蝇为例,果实蝇作为亚洲太平洋地区园艺作物果实的重要害虫之一,果实蝇的识别是检疫工作中的重要部分,建立果实蝇特征自提取分类识别系统对检疫工作有着重大意义。现有的果实蝇分类任务的对象为高清拍摄仪器所拍摄的果实蝇翅或者果实蝇中胸背板区域的样本图像,通过人工标记特征的方式选取该区域的特征点,最后利用机器学习算法进行模型的建立,特征标记过程繁琐,对果实蝇样本的拍摄仪器和使用人员的专业性要求较高,且无法自动提取果实蝇特征。基于以上问题,本文提出使用深度学习算法中的卷积神经网络算法来实现果实蝇特征自提取的分类模型,主要工作包括:(1)基于卷积神经网络的果实蝇图像分类模型:针对果实蝇样本图像少、样本图像采集设备成本高和人工手动设计及提取特征过程繁琐的问题,提出使用预训练(pre-training)好的卷积神经网络VGG-16模型来完成果实蝇样本图像的分类识别任务。首先使用高斯模糊算法对清晰的果实蝇样本图像就行模糊处理,降低样本图像的清晰度,其次利用VGG-16模型对处理后的样本图像进行训练分类,最终得到分类模型。实验表明,该模型能够自动提取果实蝇整虫的整体特征进行有效辨识,对桔小实蝇、瓜实蝇、南瓜实蝇和具条实蝇的总体识别准确率为88.33%,具有良好的应用前景。同时解决了现有的果实蝇分类识别系统需要事先人工手动设计和提取特征的问题,降低了对果实蝇样本拍摄仪器的要求,提高了模型的实用性和检疫人员的工作效率。(2)基于Bilinear CNN的果实蝇细粒度图像分类模型:详细分析了传统图像分类任务与果实蝇图像分类的异同点,发现四类果实蝇均属实蝇科,其图像类间差异较小,因此将果实蝇图像分类任务与细粒度图像分类任务相结合。而细粒度级别图像的判别信息往往存在于非常细微的区域,上述(1)中直接使用深度卷积网络方法提取整个图像级别的特征并不十分合理,因此提出使用主流的细粒度图像弱监督分类模型Bilinear CNN模型对果实蝇图像进行分类。实验表明,该模型能够对果实蝇进行有效辨识,对桔小实蝇、瓜实蝇、南瓜实蝇和具条实蝇的总体识别准确率为91.66%,相比CNN模型提高了3%左右的准确率,说明在果实蝇分类任务上,该细粒度分类模型相较CNN模型在性能上有一定的提升,具有良好的研究前景。(3)基于特征融合的FB-CNN果实蝇细粒度图像分类模型:对传统果实蝇分类任务提取的特征及其提取方法进行详细分析,发现人工通常是提取果实蝇翅和中胸背板等局部区域上的特征进行分类,且果实蝇翅上的特征间存在相对位置关系,而许多研究曾证实卷积神经网络的卷积层恰好能够提取出mid-level特征[22],而这些mid-level特征又往往对应了物体局部区域,有助于提取果实蝇翅和中胸背板等局部区域的特征。因此对(2)中的方法进行改进,提出mid-level和high-level特征融合的FB-CNN模型对果实蝇图像进行分类。实验表明,该模型能够对果实蝇进行有效辨识,对桔小实蝇、瓜实蝇、南瓜实蝇和具条实蝇的总体识别准确率为96.67%,相较CNN模型和B-CNN模型在分类性能上有了较大的提升,说明在果实蝇分类任务上,结合mid-level特征能够提高分类性能,对其它细粒度图像分类的研究具有一定的借鉴意义。本文的主要贡献有:(1)针对果实蝇图像分类任务,并将果实蝇图像分类任务区分为传统图像分类和细粒度图像分类两个任务,分别提出使用卷积神经网络模型和细粒度图像分类模型B-CNN模型进行分类,提高了果实蝇图像分类的准确率。(2)结合传统人工提取的特征间的关系,提出使用mid-level和high-level特征融合的FB-CNN模型对果实蝇图像进行分类,实验结果表明该方法对果实蝇图像分类结果有较大的提升。与Bilinear CNN以及CNN模型相比较,FB-CNN模型在果实蝇图像分类任务上有着最佳的分类性能。