基于深度学习的脱机手写体汉字识别研究

来源 :云南大学 | 被引量 : 0次 | 上传用户:aibertini
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
脱机手写体汉字识别是模式识别中较为重要的一项研究领域。由于汉字类别庞大,相似字符较多,加上书写者笔画的随意性,使得脱机手写体汉字识别在模式识别领域中具有极大的挑战性。近几年来,深度学习已经在字符识别、图像分类、目标跟踪检测等众多领域取得了突破性的进展,甚至完全取代了传统的模式识别方法。因此,本文使用了深度学习的方法对中国科学院自动化研究所(CASIA)提供的3755种脱机手写体汉字进行了识别研究。本文主要研究内容有:1、对原始数据集进行解析,并对解析出的字符图像进行了归一化处理。2、使用了长短期记忆网络(LSTM)、双向长短期记忆网络(Bi-LSTM)和VGG16对脱机手写体汉字进行了初步的识别研究。3、接着采用了卷积神经网络(CNN)和循环神经网络(RNN)相结合的网络结构CRNN(即先使用卷积神经网络对字符图像进行特征提取,然后将CNN提取的特征作为循环神经网络Bi-LSTM的输入)对该数据集进行了进一步识别研究,与前三种经典神经网络的实验结果相比识别率有很大的提高。4、根据所识别的字符特征反复搭建了适用于该数据集的卷积神经网络HCCR-Net,并得到了令人满意的结果。5、在前面研究的基础之上,使用了集成学习法(投票法)对Bi-LSTM、CRNN和HCCR-Net这三个已经训练好的网络模型在测试集上进行了投票预测。对于加权投票法的权值确定,本文提出了使用层次分析法(AHP)的思想并结合网络模型的一些常用评价指标对各网络模型进行了合理的权值确定。最后,本文对所有网络的测试结果进行了综合分析,LSTM、Bi-LSTM、VGG16、CRNN及HCCR-Net在CASIA-HWDB1.1数据集上的识别率分别为78.06%、85.25%、87.62%、92.67%和94.58%。而基于类标记和类概率的相对多数投票法的识别结果分别为94.82%和95.41%;基于类标记和类概率的加权投票法的识别结果分别为96.06%和96.33%,与前面几个单独网络模型的实验结果相比均有很大的提高。
其他文献
目的分析广东省人民医院2011-2016年门诊病例淋病奈瑟菌(淋球菌)的检出情况,为淋病的防控提供参考依据。方法对2011-2016年广东省人民医院门诊送检的生殖道分泌物标本进行淋
木材船海上运输具有一定的风险,一旦积载绑扎不当或管理不善.造成原木滚动、移位、撞击、倒塌、崩堆,从而可能引发安全事故甚至发生船舶倾覆恶性事故。为此,加强木材船的安全管
随着现代远程开放教育的发展,网络教育已成为我国教育的重要组成部分。针对当前网络教学资源建设不能满足网络个性化教学需求的现状,本文提出基于学习对象理论构建个性化网络教
本文主要从智能制造数字化车间模型、数字化车间信息安全范围、数字化车间信息安全基本原则以及数字化车间信息安全管理要求和技术要求等几个方面介绍了数字化车间信息安全。
武器的发展及运用与国际人道法的互动关系作为国际人道法的主题贯穿于国际人道法的发展之中。进入21世纪以来,武器的发展与运用对国际人道法提出了新的挑战,集中表现在以下方
挂面是中国传统的一种快餐食品,虽然起源较早,但一直作为一种辅助食品而存在,真正作为产业化生产是在八十年代,以后随着市场的需求不断扩大,生产工艺、设备的不断完善,挂面才
随着经济社会的不断发展变化,这对民商法的价值产生了一定程度的作用,民商法必须要进行相应的调整来适应社会的要求。本篇文章对社会经济的发展中民商法价值体系的变化与发展
数学从思维和技术的角度为人类文化的进步提供了方法论的基础和技术手段。因而,学习数学离不开思维。逻辑思维是数学思维的核心,是一种确定的、前后一贯的、有条理的、有根据的
从播音主持事业发展的过程中可以看出,其工作方式在不断创新,尤其是现如今,新媒体的不断涌现给播音主持工作带来了严重的挑战。另外,播音主持是一种艺术形式,这种艺术活动中
目的观察比较黄芪注射液与白细胞介素(IL)-2增强树突细胞(DCs)的抗肿瘤转移作用.方法制备C57BL/6小鼠骨髓来源的DCs,用Lewis肺癌特异性多肽Mut1预激DCs,并联合黄芪注射液或IL