基于深度学习的手写汉字识别技术研究

来源 :沈阳师范大学 | 被引量 : 5次 | 上传用户:maigcy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着知识文化的创新和科学技术的发展,人们对日常生活质量标准的要求有所提高,对电子产品功能的要求越来越多,对手写汉字提出了新的要求,手写汉字识别在处理文件、邮件的分类、商业等社会活动中都有着巨大的潜力。但汉字总量大、结构复杂、形近字多以及书写风格多变,导致汉字识别技术难度加大,现有的解决方案很难达到人们所要求的水平。目前看来,随着机器学习逐渐被研究者们所熟知,深度学习的探索之路也随之展开并在短暂的实践内成为机械学系中最受欢迎的研究内容。深度学习通过把复杂函数简单地显示出来,还能够自动获得样本概率分布,在学习样本特征中显现出超乎寻常的优势,研究者们主要把它广泛的应用于图像识别领域。因此本研究以卷积神经网络、LeNet-5结构模型和TransFlow框架等技术为基础,采用中国科学院自动化研究所采集的CASIA-HWDB1.1手写汉字数据集,通过Python编程软件加以实现。本研究前两章主要阐述研究的背景、目的和意义,然后通过文献研究法梳理国内外基于深度学习的手写汉字识别技术的研究现状,并对研究的难点问题进行分析。汉字识别技术分为两个部分,前一部分是联机手写汉字识别,计算机通过获取输入汉字已知的笔画顺序、笔画方向和汉字形状等特征进行识别,其现在的发展已经比较成熟,并且在计算机中有着广泛的应用;后一部分是脱机手写汉字识别,由于汉字数量繁多、布局复杂、相似字多和风格多变等问题导致汉字识别率仍然较低,并简单说明本研究的主要内容。本研究主要以卷积神经网络为研究基础,介绍了深度学习的相关概念与发展历程和常用方法。第三章为本研究的核心内容,先对基于深度学习的手写汉字识别技术实验进行设计,包括基于深度学习的手写汉字识别的过程设计和系统设计。然后是实验的具体过程,按照设计流程,先搭建实验平台然后确定手写汉字训练数据集和测试数据集,完成实验准备工作。接下来对样本数据图像进行归一化、平滑去噪和仿射变换等预处理,将处理完的样本图像放入以卷积神经网络为基础的LeNet-5结构模型进行学习和训练,在利用TransFlow框架中的多个高级的API进行编程,最后在已搭建好的平台环境进行具体实验,从而实现LeNet-5结构模型的功能得出手写汉字的识别结果,进一步对实验结果进行分析,最后本研究对整个研究进行总结与展望。
其他文献
现如今小学语文教育活动受到的关注度越来越高,而要想提高学生语文素养,课外阅读是一种较为有效的教学手段,也是促进学生全面发展的关键,不仅能有效激发学生阅读兴趣,还能丰
被称为“世界第三极”的青藏高原,是全球海拔最高、面积最大和独特的地理单元,更是我国生态安全的重要屏障。青藏高原的生态系统脆弱而独特,区域低温寒冷,植被生长缓慢且破坏后极
天然植物生长调节剂的开发利用是人类绿色食品生产和无污染农林业发展的重要手段,本文概述了国内外研制和开发动态,生长调节剂主要原料及生长调节的内因分析。
爱情小说在俄国流亡作家布宁的创作中占据重要的位置,其中,女性人物形象构成了其小说世界中的一道亮丽的风景线。女性形象的塑造是作家反映现实、呈现生存本质的功能显现,也
通过阐述人工湿地分类及净化污水的机理,并综合国内外人工湿地的研究进展,对影响净化效果的关键因素进行了分析。综述结果表明,人工湿地的出现和发展为净化污水提供了一条新
乌头类药物广泛用于风湿性关节炎的治疗。急性乌头碱中毒主要引起神经系统和心血管系统症状,致死原因是呼吸中枢麻痹和严重心律失常。现将1985~2005年间所收集的20例急性乌头碱
企业规章制度是企业员工行为规范和准则,只有不折不扣地贯彻落实,企业规章制度才能发挥自身作用。针对企业规章制度执行不力的现象,分析了其深层次的原因,提出了解决对策。
目的:观察中药熏蒸结合穴位盒灸对中风恢复期患者神经功能缺损程度及继发并发症的影响。方法:选择249例中风恢复期患者,随机分为对照组、穴位盒灸组和熏蒸加穴位盒灸组。三组
安丰塘世界灌溉工程遗产是世界农田水利工程的杰出代表,至今对淮河流域农业发展和城市繁荣发挥着重要作用. 基于寿县区域多时相TM/ETM+ 遥感影像、DEM 地形专题图,结合历史文
《道路交通安全法》第六条的核心是交通安全宣传教育,目的是使交通参与人了解、熟悉、遵守交通法规。但该法条只规定了政府机关、学校、媒体、企事业单位等有交通安全教育的