基于深度学习的图像识别系统算法研究

来源 :成都信息工程大学 | 被引量 : 0次 | 上传用户:zhulixiao66
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机硬件性能的快速提升、海量数据学习算法的发展以及对神经网络的深入研究,深度学习方法被广泛的应用于图像识别任务中,其中卷积神经网络优异的性能在图像识别任务中大放异彩,并在诸如语音识别、运动预测、医疗诊断等领域均有良好的表现。卷积神经网络相比于传统的人工神经网络更好的模拟了视觉神经元对图像信息的响应,使用稀疏连接的方式极大地降低了神经网络的参数规模,使用共享权值的方法将卷积层的每个卷积核重复的用于提取图像特征的过程,最大可能的减少了模型参数的数量,有效的提升了模型的训练效率。基于卷积神经网络的图像识别方法避免了传统方法繁杂低效的特征提取,将图像的特征分析也融入了模型训练过程中。虽然卷积神经网络模型在图像识别任务中取得了显著的成绩,但是在面对移动设备、嵌入式系统等计算资源有限的平台时,传统的基于深度学习的模型由于参数量及运算量较为庞大便不再是一个理想的选择,因此本文在保证模型性能的前提下,对如何简化模型的网络结构和参数方法做了深入研究,并且提出了基于原始MobileNet的改进模型。本文的主要创新性研究工作主要包括以下三点:1、针对现有模型为了提升性能,不断加深模型结构层数、增大参数量的情况,本文在通过大量文献阅读后选择了MobileNet作为基础研究模型,该模型的创新之处是将传统的卷积运算替换为了深度可分离卷积运算,这种卷积运算是二维深度卷积与三维逐点卷积的结合,将传统卷积运算相乘的方式改为了相乘与相加结合的方式,极大的减小了模型的参数量与运算量,同时保持了对图像识别任务的准确率要求。在原始模型的基础上,本文该模型的平均池化层做了改进,平均池化层的应用会降低图像显著特征的表现,本文使用了全局深度卷积的方法对该问题做了优化和改善。2、本文对目前深度神经网络中流行的多种优化器做了深入研究,并针对每种优化器的优缺点做了总结和分析,并且提出了将原始MobileNet所使用的RMSprop优化器使用目前综合性能更好的Adam优化器替代,通过本文的实验验证,此方法对提升模型的训练的稳定性及准确率均有提升作用。3、针对模型训练耗时较长的问题,本文使用迁移学习的方法,将在ImageNet数据集上经过训练的模型参数应用于本文实验模型中,有效的提升了模型的收敛速度及准确率。综合以上三点对原始模型的改进方法,本文所提出的模型相比于原始模型在本文所采用数据集上,训练准确率提升了大约1%,测试准确率提升了大约3%,同时在模型过拟合率方面也比原始模型更好。
其他文献
随着计算机图形学的快速发展,三维场景可视化技术已经在工程设计、军事应用和智慧城市规划等领域得到了广泛应用。三维地震采集观测系统是石油勘探开发研究中不可或缺的一部
无缝桥提高了行车舒适度并降低了后期维修费用。近半个世纪来,它已在欧美等国得到了广泛的应用。近些年,我国也加入了无缝桥梁的研究行列。经研究发现,通过在枕梁下增设一排
在非连续正交频分复用系统中,由于峰值功率平均比(PAPR)较高,导致发射端硬件设备难以实现,严重制约其实用性。为此,提出一种改进型子载波预留PAPR抑制算法。根据频谱感知结果,
近年来,由于新颖的拓扑结构以及在光催化材料、分子储存材料、发光材料、导电材料和磁性材料等领域的应用,配位聚合物已成为科研工作者的研究重点。在众多的配位聚合物合成技
针对无线信道传输视频信号易发生丢包的现象,提出基于H.264/AVC的自适应时空错误隐藏算法。依据场景是否发生变化自适应选择空域错误隐藏或时域错误隐藏。时域错误隐藏采用时空结合边界匹配法,保持平滑性和结构相似性。空域错误隐藏采用多方向插值法,恢复主要边缘后沿每个主导边缘方向插值得到近似值,并利用加权平均法恢复像素值。实验结果表明,与Motion Copy,JM10.2,Kung算法相比,该算法具有
氮氧化物(NO_x)是构成大气污染物的主要来源之一,随着我国火电厂NO_x排放标准日趋严格。选择性催化还原(Selective Catalytic Reduction,SCR)烟气脱硝技术因其具有对机组运行
教育者,应以智慧去诠释教师,用爱心去经营班级。因此,为人师者应该独具慧眼,以德育人;应该刚柔并济,学会倾听;应该融身班级,形成合力,还要循循善诱,激发动力。让教师的喝彩,
结核病是严重危害全世界人类健康的一种慢性传染病。其致病菌为结核分枝杆菌,结核分枝杆菌具有强大的适应能力可以在宿主的免疫效应中生存,因此结核病是一种持续时间长的慢性