论文部分内容阅读
计算机视觉是人工智能领域里的一个重要的分支,图像识别是计算机视觉领域中的重要研究方向。近年来随着深度学习技术的快速发展,图像识别技术也有明显的进步。从早期的Alex Net到VGG-16,再到Res Net101,基于深度神经网络的图像识别模型的识别精度越来越高,但是模型的稳定性仍然有待提高,尤其是面对复杂的光照和拍摄角度,对一个物体的识别精度也有着很大的区别。因此,针对复杂光照和多拍摄角度下的图像识别问题,本文将多智能系统和深度神经网络相结合,基于深度神经网络建立了多卷积神经网络协作模型并将其应用到复杂光照下的图像识别、猪脸识别和轮胎X光病疵检测中。与传统的深度学习模型相比,本文提出的模型对复杂光照和多角度拍摄下的图像识别有更好的稳定性。本文主要内容包括以下三个部分:(1)针对复杂光照下的图像识别问题,结合多智能系统的思想和多种传统数字图像处理的特征提取方法提出了一种基于多卷积神经网络协作模型的图像分类方法。该方法首先通过特征提取和聚类对数据集进行预处理,削弱了复杂光照对图像的影响。多卷积神经网络协作模型根据输入图像的PCA特征向量、LBP特征向量和HOG特征向量分别启用对应的卷积神经网络模型对图像进行识别,多卷积神经网络协作模型将各个卷积神经网络的输出结果融合得到图像最终检测结果。实验证明,多卷积神经网络协作模型在复杂光照环境的图像数据集中有着更好的分类精度。(2)针对复杂光照下和多角度拍摄下的猪脸识别问题,结合语义分割,提出了基于语义分割的多卷积神经网络协作猪脸识别算法。猪脸识别是通过猪的图像对猪的身份进行判别,由于猪舍的环境比较阴暗拍摄到的图像往往光照条件不均匀,并且猪不是一直面对着摄像头,猪脸识别难度一直较高。由于猪的各个部位特征差距较大,整猪识别无法得到令人满意的结果,本文构建了一个基于语义分割的多卷积神经网络协作模型,该模型即能识别整猪图像还可以通过语义分割找到输入图像中猪的头部和尾部并进行识别,模型将头部,尾部和整猪图像的识别结果融合得到最终的检测结果。通过实验可以证明,与传统深度学习模型相比,本文提出的模型对复杂光照下和多角度下的猪脸识别有着更好的检测效果。(3)轮胎X光图像是通过X光机拍摄得到轮胎的内部结构,当轮胎包含不同病疵时,其内部结构也会有相应的改变。目前主要的检测方法是通过人工识别病疵,无法时刻保证准确率。由于不同型号的轮胎有着不同的内部结构,传统的目标检测模型在检测时会将某种型号的正常轮胎X光图像识别为包含病疵的图像。针对上述问题,本文将多卷积神经网络协作模型的思想应用于Faster R-CNN,提出了基于目标检测模型的协作X光病疵检测算法。每个目标检测模型对应着一种型号的轮胎,当特定型号的轮胎检测出特定类型的病疵时,会将图像输入到一个判别模块中得到最终的检测结果。在轮胎X光图像病疵数据集中,本文提出的方法有着更好的准确率和更高的召回率。