论文部分内容阅读
近几年是互联网飞速发展的时期,越来越多的人们在网上浏览新闻、进行社交等等,这为图像信息的传递提供了非常方便的媒介。图像数据简单直观,包含了丰富的信息,作为信息交换的载体被广泛应用,因而图像识别任务近年来成为了科学家们的研究热点之一。目前的图像识别算法主要包括传统和新型两种类别,其中传统的图像识别算法以图像为基础进行处理,新型的是以人工智能为基础的。传统的算法需要专业的知识、精心的设计来进行特征提取,比如LBP、Ho G、SIFT等,而且花费时间长,不能实现实时的处理,准确率也不能保证。但是基于人工智能的新型图像识别算法相对于传统算法来说更加简单而且速度快,比如说近几年的研究热点——卷积神经网络,它可以通过半监督甚至是无监督的方式自行提取图像的特征,与手动提取相比,这种方式能够更精准的提取到重要的特征,从而提升模型的准确率。但是,卷积神经网络往往需要训练数千万甚至数亿的参数才能完成对新目标的预测,除了需要较长的训练时间外,还可能因数据量不足而导致过拟合。因此本文重点研究如何在小数据集上应用卷积神经网络来快速准确的完成图像识别任务,提出了一种基于卷积神经网络、利用迁移学习和集成学习搭建的复杂度低、识别准确度高并且效率高效的图像识别模型。本文的主要研究成果如下:1)针对卷积神经网络的结构,分析其在进行图像识别任务时每一层的功能和效率,发现了它在特征提取方面的独特优势以及它训练时间过长的原因之——全连接层参数众多。综上,将卷积神经网络作为一个特征提取器,仅进行对图像的特征提取,并替换掉最后一层全连接层。本文将Inception-v3模型迁移过来可以在八分钟之内完成特征提取。2)将卷积神经网络提取到的图像特征作为传统学习器的输入可以显著的提升模型的准确率,本文中利用Inception-v3进行特征提取,然后分别作为支持向量机、逻辑斯蒂回归和k近邻的输入,通过这种方式搭建的模型,其rank-5准确率分别是99.02%、95.83%以及99.26%。3)利用集成学习将三个模型进行集成,进一步提升了模型的准确率。最终模型的rank-1准确率为96.32%,rank-5准确率为99.51%。