基于深度残差网络的手写体数字识别研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:kilmic1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
21世纪是一个大数据时代,以计算机为载体的数字化信息在世界各个角落传播。传统的人工数据录入工作效率低、耗费人力财力,为了将计算机办公与数据录入有机结合,手写体数字识别技术提供了一种有效的手段。手写体数字识别由于其自身结构特点存在诸多问题,无论在技术领域还是应用领域仍值得我们研究探索。深度学习(Deep Learning)是机器学习领域里最大的浪潮,是一种包含多个隐藏处理层的深层次网状结构计算模型,通过对数据的特征学习来获得数据的多抽象层表示。近年来大规模数据集的出现以及高性能计算机硬件的发展对深度学习研究起到了至关重要的作用,随之深度学习在计算机视觉处理、自然语言处理以及语音识别等诸多方面得到了应用。本文首先介绍神经网络的相关理论知识和优化方法,主要包括神经元模型、多层感知器、BP神经网络、局部感知、下采样、权值共享、卷积操作、激活函数、池化、Softmax回归、批量归一化、正则化等。分析采用深度神经网络模型做手写体数字识别研究时容易产生过拟合的问题,并提出解决方案。针对数据集较少时容易导致过拟合的问题,本文采用数据增强的解决方案。解决方案中介绍生成式对抗网络的相关理论知识,包括生成器和判别器,据此设计深度卷积生成对抗网络做数据增强,并提出相应网络优化方法。通过实验将该方法与传统数据增强方法作对比,实验结果表明生成式数据对模型性能提升效果优于传统方法,数据增强有效提高了模型的性能。接着分析了采用深度神经网络模型做手写体数字识别时极易出现梯度消失和爆炸的问题。针对梯度消失和爆炸问题本文采用在深度神经网络中加入残差模块的解决方案。方案中主要介绍残差网络的相关理论知识,包括短连接和卷积层分叉思想,通过改变残差块卷积层宽度、引入批量归一化和添加Dropout层搭建网络模型并完成训练,有效避免了梯度消失和爆炸的情况,同时提升了模型学习效率。通过实验分析Batch Size、学习率和Dropout值对网络性能的影响,确定了一个性能较好的识别模型,该模型相较于传统卷积神经网络模型在识别率上有较大提升,同时具有更强的鲁棒性。本文最后展示了一个简易的手写体数字识别系统,该系统完成了数据输入、网络预测、识别结果输出的功能。实验表明,设计的简易识别系统具有较高的识别率。
其他文献
住宅会出现中部细腰连接的结构,而且有些远小于规范的限值,本文通过一个工程实例,分析了地震中结构的整体性,细腰处的剪力墙性能验算及楼板应力分析,以及罕遇地震下的弹塑性
改革开放四十年来中国经济社会的发展成就举世瞩目,中国特色社会主义进入新时代,而文化是一个国家和民族的灵魂,推动社会主义文化繁荣兴盛、坚定文化自信的时代任务就变得越
大数据时代的由来,主要是现阶段计算机技术在诸多领域得到广泛应用,且网络信息技术在全世界范围内覆盖面以及非常大,可以说人们无时无刻都在接触与使用这些全新的技术,鉴于其
目的:研制一套基于现场可编程门阵列(field-programmable gate array,FPGA)的高频超声皮肤三维扫描控制及数据采集系统,用于控制皮肤等浅表器官的高频超声三维扫描和高频超声二
《红楼梦》作为我国古典小说的巅峰,无论在文化性还是艺术性方面都有很高造诣。曹雪芹在书中通过大观园庭院布局、居室陈设、植物栽植等充分反映了各主人公的个性、情趣、思
综合实践活动课是一门综合程度极高的课程,本文主要从八个方面阐述了实施综合实践活动课与语言智能、逻辑—数学智能、空间智能、身体运动智能、音乐智能、人际关系智能、自
目的探究分析低剂量螺旋CT对早期周围型肺癌筛查的应用。方法回顾分析我院2016年7月-2018年7月我院收治的已确诊的患者70例。所有患者均采取低剂量螺旋CT检查和胸部数字化X线
基于引江济汉工程渠道4标段在文明施工管理和考核中的实际情况,采用层次分析方法,建立了水利施工企业文明施工评价指标体系和评价指标,分析了综合管理、施工场地布置及管理、
为了方便大型仓储系统智能管理,针对传统仓储系统低效率、低自动化程度等问题,文中提出将IOT应用技术、嵌入式Linux技术、ZigBee技术等前沿技术整合思想。设计完善的物联仓储
本文对近年来在我国高校逐步普及使用于外语教学与考试的音频无线传输系统,作了较系统的论述,对进一步推广运用这新技术,提出了一些新的见解与实践经验。