论文部分内容阅读
图像识别是人工智能领域的一个重要方向。经过多年的研究,图像识别技术取得了一定的研究进展。图像识别主要包含特征提取和分类识别,而其中的特征提取是图像识别技术发展的瓶颈问题,直接决定着识别性能的好坏。传统提取的特征主要分为全局特征和局部特征,但是这些特征都是图像底层的视觉特征,并且需要具备一定专业知识人员进行特征的设计与选择,这种人工设计的特征需要经过大量的验证后才能证明其对某一种识别任务的有效性,这也在一定程度上限制了图像识别技术的应用。近年来,随着大数据时代的来临和计算资源越来越便宜,深度学习技术不断取得进展。它是一种以数据为驱动,从图像识别任务中的大量数据来自动学习特征。为此,本文首先对深度学习进行了研究,然后将其应用到敏感图像识别和车牌识别中。本文的研究内容主要包括以下几个部分:首先,本文深入研究了深度学习。重点研究了深度学习的特征提取,以及深度学习中三个重要的网络模型,分别是可以实现无监督特征学习的深度信念网络(Deep Belief Network,DBN),图像识别任务中被广泛使用的卷积神经网络(Convolutional Neural Network,CNN),以及可以实现序列数据学习的循环神经网络(Recurrent Neural Network,RNN),对它们的网络结构和训练方法展开深入的研究。实验表明,深度学习网络可以对不同的识别任务,从图像数据中学习分层特征,最后形成不同类别对象之间的区分性特征。其次,提出了一种基于卷积神经网络(CNN)的敏感图像识别方法。该方法分为两个步骤:粗检和细检。粗检用来快速识别出不含或含肤色区域较少的正常图像以及大头照,因为大部分图像都属于正常图像,这可以极大降低识别时间。对于包含肤色较多的图像,则进一步通过细检识别。首先使用大量标定好的敏感图像和非敏感图像训练CNN分类模型,然后采用分类模型进行敏感图像的识别。在包含19000多幅图像的数据库上的实验结果表明,采用本文所提出的方法识别准确率可以达到97.2%,远远高于传统的敏感图像识别方法。最后,针对传统车牌识别算法存在车牌定位、车牌校正、字符分割、字符识别等多个过程,每个过程都会影响车牌识别率的问题,提出了一种基于卷积循环神经网络(Convolutional Recurrent Neural Network,CRNN)的车牌识别算法。该算法包含车牌定位和车牌识别两个部分:首先使用基于边缘的车牌定位方法确定图像中车牌的候选区域,然后采用CRNN网络进行车牌的训练和识别。相对于传统的车牌识别技术,本文提出的算法是一种端到端的识别方法,无需进行车牌校正、字符分割等处理,给车牌识别提供了另一种思路。实验结果表明,车牌整体识别正确率为76%,车牌后六位字符的识别正确率为91%。