论文部分内容阅读
随着计算机硬件性能的快速提升、海量数据学习算法的发展以及对神经网络的深入研究,深度学习方法被广泛的应用于图像识别任务中,其中卷积神经网络优异的性能在图像识别任务中大放异彩,并在诸如语音识别、运动预测、医疗诊断等领域均有良好的表现。卷积神经网络相比于传统的人工神经网络更好的模拟了视觉神经元对图像信息的响应,使用稀疏连接的方式极大地降低了神经网络的参数规模,使用共享权值的方法将卷积层的每个卷积核重复的用于提取图像特征的过程,最大可能的减少了模型参数的数量,有效的提升了模型的训练效率。基于卷积神经网络的图像识别方法避免了传统方法繁杂低效的特征提取,将图像的特征分析也融入了模型训练过程中。虽然卷积神经网络模型在图像识别任务中取得了显著的成绩,但是在面对移动设备、嵌入式系统等计算资源有限的平台时,传统的基于深度学习的模型由于参数量及运算量较为庞大便不再是一个理想的选择,因此本文在保证模型性能的前提下,对如何简化模型的网络结构和参数方法做了深入研究,并且提出了基于原始MobileNet的改进模型。本文的主要创新性研究工作主要包括以下三点:1、针对现有模型为了提升性能,不断加深模型结构层数、增大参数量的情况,本文在通过大量文献阅读后选择了MobileNet作为基础研究模型,该模型的创新之处是将传统的卷积运算替换为了深度可分离卷积运算,这种卷积运算是二维深度卷积与三维逐点卷积的结合,将传统卷积运算相乘的方式改为了相乘与相加结合的方式,极大的减小了模型的参数量与运算量,同时保持了对图像识别任务的准确率要求。在原始模型的基础上,本文该模型的平均池化层做了改进,平均池化层的应用会降低图像显著特征的表现,本文使用了全局深度卷积的方法对该问题做了优化和改善。2、本文对目前深度神经网络中流行的多种优化器做了深入研究,并针对每种优化器的优缺点做了总结和分析,并且提出了将原始MobileNet所使用的RMSprop优化器使用目前综合性能更好的Adam优化器替代,通过本文的实验验证,此方法对提升模型的训练的稳定性及准确率均有提升作用。3、针对模型训练耗时较长的问题,本文使用迁移学习的方法,将在ImageNet数据集上经过训练的模型参数应用于本文实验模型中,有效的提升了模型的收敛速度及准确率。综合以上三点对原始模型的改进方法,本文所提出的模型相比于原始模型在本文所采用数据集上,训练准确率提升了大约1%,测试准确率提升了大约3%,同时在模型过拟合率方面也比原始模型更好。