论文部分内容阅读
随着图像拍摄设备、智能手机和互联网技术的发展,纹身图像的采集、传播变得越来越容易。伴随着突发事件的发展,纹身同其它生物特征一样,成为对罪犯嫌疑人识别的有力证据。如何对纹身图像进行检测和语义解读,并为相关部门和人员提供有力的证据,已引起安全部门的重视。纹身图像具有明显的图案信息的局部性、内容的复杂性、纹理的清晰性、颜色的单一性、图案Logo标志性、大小形状多样性等特点。这些特点使得纹身图像的检测与识别相对比较困难,同时也使得很难用单一的特征对其描述。深度学习通过逐层追叠形成多层的网络结构,这种结构可以从底层到高层逐层提取到图像的高层特征,从而有效对图像进行表示。这使得深度学习逐渐成为学术界、企业界研究的热点,同时也为纹身图像检测提供了一种新的途径。本文的主要工作是紧密围绕纹身图像的特点和现有的深度学习理论,展开深入的研究,提出针对纹身图像检测的若干改进算法。本文的主要工作和贡献包括以下几个方面:1.四种主要深度学习算法在纹身图像检测中的比较研究。通过分析纹身图像的特点,探讨哪种算法比较适用于纹身检测的研究工作。实验结果表明,在纹身检测方面,四种深度学习算法比传统的方法的性能更好,其中深度卷积神经网络和深度置信网络的性能更为突出。2.基于多特征融合的深度置信网络纹身图像检测改进算法(MF-DBN)。纹身图像的内容复杂性、纹理的清晰性、颜色的单一性等诸多特点决定了单一特征很难对其进行准确描述,同时像素又比较高。传统的DBN算法比较适中小尺寸的图像识别任务,针对这些问题,从多特征融合的视角,设计了一个基于纹身图像的多特征融合深度置信网络改进算法(MF-DBN),有效地解决了纹身图像高维性和单一特征描述不足的问题。在NIST纹身数据集上正确率达到96.89%,比NIST公布的最好正确率提高了0.59%。3.基于视觉词包的深度置信网络纹身图像检测改进算法(BOVW-DBN)。该算法不仅解决了输入高维性的问题,还针对纹身图案的局部性、大小不一性等特点,利用SIFT算法,建立中层词包语义模型,有效的实现对纹身图像的检测与识别。在NIST纹身数据集上正确率达到97.57%,比NIST公布的最好正确率提高了1.17%;在Flickr 10K上的正确率也达到79.27%。4.基于空间金字塔的深度置信网络纹身图像检测改进算法(SP-DBN)。该算法利用SPM模型,针对纹身图像的大小及空间分布等问题,解决了纹身图像的空间信息特征提取问题,实现纹身图像检测。实验结果显示,在NIST纹身数据集上正确率达到97.23%,比NIST公布的最好正确率提高了0.93%;在Flickr 10K上的正确率达到80.46%。5.基于三通道融合的卷积神经网络纹身图像检测改进算法(CFT-CNN)。针对全连接层在不同尺度下的特征抽取能力,首先根据纹身图像的检测问题设计了一个简单的单通道T-CNN模型;在单通道T-CNN模型的基础上,又设计出一个三通道连接层的卷积神经网络模型(CFT-CNN),并应用到纹身图像检测的任务中。同时针对纹身图像的特点做了相应的预处理。在NIST数据集上,CFT-CNN的正确率达到97.87%,比NIST公布的最好结果提高了1.57%,在Flickr 10K数据集上的正确率也达到85.61%。6.基于三通道融合的Faster R-CNN纹身图案检测改进算法(CFT Faster RCNN)。该算法针对纹身图像大小、尺度变化大等问题,在Faster R-CNN的基础上,充分考虑到全连接层在不同尺度下的特征提取能力,在ROI池化后增加一个三通道的全连接层,解决了纹身图像位置识别困难的问题。实验结果表明,在NIST数据集上,本算法比Faster R-CNN算法在MAP上提同了3.35%,在IOU上提高了4.59%。最后,对基于DBN和CNN的纹身图像检测改进算法进行了对比研究。结果表明改进算法在NIST上性能有所提升,其中改进的CNN算法的效果更好。在改进的DBN方法中,由于词包模型是在SIFT特征基础上对纹身图像进行表示,在小数据集上更好。SP-DBN算法由于考虑到空间信息,对大一些的数据集的效果相对较好。从NIST和Flickr两个数据集的实验结果来看,NIST数据集存在一定局限性,Flickr数据集更接近现实环境。