基于深度学习的中文手写汉字分析

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:chris916
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
中文手写汉字识别已经有很长的研究历史。基于其极高的应用价值被广泛地被应用在邮件信息检索、手写文档识别以及电子设备输入等各个场景之中。近年来,以深度学习为主的机器学习方法被大量应用在图像处理等相关领域,也为手写汉字识别等问题带来了革命性的突破与发展。相较于传统方法,高识别率以及端到端封闭式的处理方式使得基于深度学习的算法已经成为本领域的主流研究方法。但现目前已经提出的深度学习模型主要以应用相关图像领域现有的成熟网络结构为主,并未针对汉字特有的结构特征与信息加以利用。因此,对于中文手写汉字的深度学习仍然需要进一步的研究。在本论文中,我们从中文汉字的构字特点出发,对手写汉字中的偏旁部首特征提取方式进行深层次的探究。通过对偏旁部首区域性特点的分析,提出了一种改进的卷积神经网络结构框架来提高对于中文手写字符的识别率。与现有的特征提取方式相区别的是,通过将全连接层更改为相对应的整字级别的模块和偏旁部首区域级别的模块,新提出的方法能够包含更多的偏旁部首级别的特征。在此基础上,考虑到神经网络在训练中与训练数据库大小的紧密联系,我们提出了一种新的训练数据增强方法。由于在大多数汉字中的偏旁部首拥有不同的书写风格,我们将数据库中的样本根据每一类汉字的分割成不同偏旁部首的子图之后,随机地从候选的子图中重新组合成新的训练样本。除此之外,为了在训练之中有效地减少网络的输出在特征空间中的类内距离,在训练之中加入了center loss损失函数进行联合训练。考虑到偏旁部首在通常在词组中的汉字具有紧密的联系,我们还将其作为新的特征提取器对偏旁部首信息在脱机手写中文文本行识别中的应用进行了探究。在利用的卷积神经网络的输出之中,保留了偏旁部首的特征信息,使得相邻汉字中根据相关偏旁部首出现的条件概率对文本行中的字符的识别能够拥有更多的信息。在利用滑动窗对文本行的内容转化成图片序列之后,在双向长短记忆单元模型中对输入的序列进行识别。为了验证测试论文中所设计模型以及训练算法的有效性,我们分别使用CASIAHWDB数据集中的手写字符以及文本行数据库进行了测试。实验结果证明所提出的算法在脱机手写中文字符识别的识别率能够达到97.91%,能够在一定程度上提升模型识别的准确率。同时,利用此卷积神经网络作为特征提取器的双向长短记忆单元模型能够进一步提升脱机手写中文文本行的识别率,在无语言模型进行后处理的情况下,对文本行的识别准确率可以达到90.78%。
其他文献
目的:探讨对鼻腔灌洗液中细胞因子IL-4、IL-13、INF-γ、TSLP的含量及鼻黏膜TSLP的影响的研究。方法:采用OVA致敏大鼠,复制AR模型,成功后并分成2组,分别为AR组和AR+辛夷滴鼻
纳税评估是一项国际通行的税收管理办法,自1998年引入我国后,一直处于摸索阶段。2012年,国家税务总局明确了以风险管理为导向的征管模式,而后以规范性文件的形式明确了把纳税评估作为税收风险应对的一种方式,并在全国广泛开展。随着征管改革的深入,纳税评估在基层税务系统已成为税源管理的重要手段,在堵漏增收方面发挥了积极的作用,但同时评估工作也开始显现一些深层次的问题。许多学者都注意到纳税评估存在的问题,
随着全球经济一体化,许多企业会将自身的物流业务外包出去,以便专注发展自身的核心能力。为了采购运输服务,企业需要选择优秀的运输服务商来满足自身的运输服务需求。在采购
目的1.探讨膝关节翻修术中应用Sleeve金属袖套处理干骺端严重骨缺损结合MBT假体的早期临床效果。2.采用Sleeve金属袖套结合MBT假体行膝关节翻修术后关节线改变与膝关节功能的相关性研究。方法1.回顾分析2015年3月至2017年4月,在解放军总医院骨科由同一位主刀医师应用Sleeve金属袖套重建干骺端骨缺损结合MBT假体行膝关节翻修术的23例(24膝)患者,男8例(8膝),女15例(16膝
工程植筋技术在目前应用颇多,但技术规范尚未出台.故根据工程实践,对植筋锚固长度、抗拔力、间距、安全系数进行研究与探讨,提出了若干技术措施并用实例加以说明.
港汇广场是上海最大的综合商场之一,地处交通繁忙的纵横(市三纵三横之一)路口,在没有常规的"施工现场"和"施工围墙"条件下续建超高层工程,困难之大可想而知.介绍了混凝土泵管
推导出了全息多重存储时间递减曝光法各幅图象写入时间的解析表达式,研究了时间递减法和循环曝光法单次曝光时间、总曝光时间以及循环次数随存储图象的幅数之间的变化关系,结果
融资租赁这一概念自上世纪80年代引入我国以来,得到了广泛应用,融资租赁交易成为广大企业所采用的重要融资与融物手段。其融资与融物相结合的特点决定了其不同于传统的租赁交易,这一特点是融资租赁交易的优势所在,但同时,也带来一些问题。本文主要从承租人或出租人破产时,融资租赁合同及租赁物该如何处理这一角度展开研究。本文开篇部分对融资租赁的概念、性质,结合各学说及我国现有法律法规展开分析,明确了融资租赁物的所
以浙江工业职业技术学院为例,分析当前高职院校公共艺术类选修课程教学中存在的问题,从思想认识转变、师资队伍组成、课程体系设计等方面入手,试图构建以通识教育为基础,研究适合
酒泉市位于中国西北内陆河西走廊地区,气候干燥寒冷,降水稀少,大部分地区地表裸露,沙尘暴易发。作为河西走廊地区的工业重镇,酒泉市在常年受到沙尘暴侵袭的同时,也受工业和交