论文部分内容阅读
随着智能化时代的到来,人工智能技术变得炙手可热,尤其是图像识别技术,更是广泛应用于医学、军事、教育等各大领域,但在养殖业领域的技术研究却略显不足。传统的猪只养殖依靠人工的巡逻和观察以确保猪只的健康,目前的猪只检测技术也都是基于传统的图像处理方法,不仅准确度低,而且消耗大量的时间成本。为了解决此类问题,就需要采用基于深度学习的猪只检测技术,使得检测速度更快并且准确度更高。为了提高猪个体检测位置定位的准确度,本文提出基于深度学习的猪个体检测技术,该框架在传统的Mask-RCNN(Mask Region Convolutional Neural Network)模型上,改进了位置定位边界框损失函数的计算方法,确保模型的位置定位更加准确。主要分为以下三个研究内容,(1)针对训练数据集不足问题,采用自制数据集,其中自制数据集包含以下三种方法:第一,借助labelme数据集制作软件进行手动人工数据集的标注。第二,进行图像自动生成扩展数据集的多样性。第三,采用数据增强技术对标注好的图片进行剪切、旋转、镜像等图像变换方法增加数据集的丰富性。(2)针对传统检测方法检测速度慢的问题,引入深度学习方法,选用Mask-RCNN网络模型进行图像的训练,由于模型中特殊的区域生成网络(Region Proposal Network,RPN)层,使图片输入尺寸可以任意大小,也使自制数据集中因为图片变换后导致的图片多尺寸问题得到了解决。通过实验得知,该方法较传统图像检测方法检测速度上有了大幅度的提升。(3)针对位置定位准确度不高问题,改进了Mask-RCNN模型,提出了基于相对熵(Kullback-Leibler,KL)的损失函数代替传统的框回归损失函数以及软化的非极大抑制(soft non-maximum suppression,soft-NMS)代替非极大抑制(non maximum suppression,NMS)的方法。该方法通过KL散度量化真实误差和标准误差之间的差距,最小化两者之间的差距来作为损失函数。将非极大值抑制中重叠度(Intersection over Union,IOU)大于阈值的框通过抑制其置信度来代替直接置零的操作。通过对比实验,较传统模型相比,基于KL散度和软化非极大抑制的方法有着更准确的位置定位的优点。本文搭建了改进后的Mask-RCNN模型,采用自制猪数据集进行模型的训练,确保实验的可行性。通过四个对比实验,得出了在相同训练参数和相同网络模型下,改进后的方法较传统方法相比,平均准确度提高了2%以上且有着更准确的位置定位。通过与前人的Mask-RCNN对猪个体检测的实验对比,本算法在猪体个位置定位准确度上提升了1.8%。其次针对不同数量的猪数据集分别进行了实验,得出了在数据集更加丰富的情况下,改进后的Mask-RCNN网络模型识别准确度更高。最后分别进行了基于MS COCO(Microso-ft Common Objects in Context)数据集的fast-RCNN(fast Region Convolutional Neural Network)与faster-RCNN(faster Region Convolutional Neural Network)的对比实验,得出改进后的模型对位置定位的准确度提升了1.6%和2.5%且在和前人的fast-RCNN与faster-RCNN基于COCO数据集的对比实验中,本文所用的算法,在回归框的平均准确率上面分别提升了1.5%和0.8%。