基于深度学习的手写汉字识别技术研究

来源 :哈尔滨理工大学 | 被引量 : 0次 | 上传用户:fangduohui129
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
世界上使用人数最多、信息存储最简练、运用最广泛的语言文字,是中国传统文化和世界文化不可或缺的重要部分,所以针对汉字图像的识别研究具有非常重要的实用价值。手写汉字识别在日常的办公自动化、邮件分拣、金融等领域都具有非常很好的前景,手写汉字识别的研究可以使人们的日常生活更便捷。但是由于汉字的类别多,并且结构复杂,存在大量的相似汉字,再加上不同的人有不同的书写风格,在不同的书写环境、书写方式情况下,手写出来的汉字图像从种类和相似度等方面都很复杂,这就使得手写汉字识别在模式识别领域一直是难点同时也是研究热点。近年来,深度学习成为机器学习领域最热门的研究内容,尤其是在图像识别领域取得了非常好的效果。它能将复杂函数用更简洁的方式表达,可以自动获取样本概率分布同时在学习样本特征上具有优势。因此本文将深度学习模型应用到脱机手写汉字识别任务当中,通过使用深度学习中不同的方法和模型,进一步提高手写汉字识别的准确性。本文研究内容主要分以下几个方面:首先从深度信念网络入手,分析了传统手写汉字识别方法的不足,提出了一种基于深度信念网络融合模型对手写汉字识别的方法。该方法首先用修正的二次判别函数分类器识别较为简单的汉字,而较为复杂的汉字图像交给深度信念网络模型来处理,具体的分工过程通过定义可信度来协调两个分类器在识别任务中的分工,从而达到理想的识别效果。然后从卷积神经网络入手,卷积神经网络优于传统的图像分类方法在特征提取方面,所以将卷积神经网络应用在脱机手写汉字识别问题中。分析了卷积在手写汉字处理中的优缺点,针对相似手写汉字分类问题,进一步改进卷积神经网络,充分利用网络中特征提取的优势,二分类器则采用经典的SVM分类器,两者结合更好的对相似手写汉字识别分类。本文实验选用MNIST手写字、中国科学院自动化研究所采集的CASIA-HWDB1.1、北京邮电大学采集的HCL2000数据集。实验表明,本文提出的基于卷积神经网络的手写汉字识别方法能取得较好的识别效果。
其他文献
<正> 心智发展的脑机制是认知神经科学的重要问题,发展的认知神经科学研究脑神经发育与认知发展之间关系,关注发展心理学的传统主题,如天性与教养、发展的连续性与非连续性和
目的:探索半夏醇制减毒新方法和最佳工艺参数。方法:以乙醇润制半夏减毒,采用正交试验设计考察乙醇量、润制时间、乙醇浓度、润制温度4个影响因素,以总游离有机酸含量为化学
利用CITESPACE与CNKI数据库,通过图谱以空间形式在一定时间范围中系统的可视化显现,揭示出旅游人类学的研究现状:研究主体分布、派系与合作,研究主题的知识结构及其演化规律
核心提示——$$往昔,遵义的进出口企业只能颠簸于重庆、贵阳等地,如今,这个有着上千年文明史的历史文化名城,拥有了自己独立的国际陆港——贵州黔北现代物流新城。这座现代化、
报纸
本文针对目前我国翻译教学中关于建构主义的模糊认识,系统阐述了建构主义4个基本学派的主要观点,揭示了各个学派对翻译教学的启示。文章提出翻译教学应融合建构主义各派之长,
国内旅游人类学的研究起步较晚,创新性不足。但近年来,众多学者运用西方人类学的研究方法和成果对国内的旅游现象进行了深刻的诠释,在旅游人类学的本土化上迈出了重要一步。
近年来,国家高度重视物流业发展,密集出台了一系列促进物流业发展的利好政策,为物流业发展营造了良好的环境。特别是国家“一带一路”战略的实施,不仅给我国物流业带来全新的发展
报纸
<正> 简牍秦代书法遗迹中最珍贵的要推1975年12月在湖北云梦睡虎地秦墓出土的1100余枚竹简。这些简文为墨书秦隶,是秦始皇统一全国后五六年的遗物。简长23.1-27.8厘米,以墨书
<正>随着我国人口老龄化程度的不断增加,冠心病的发病率亦逐年增加,起搏器的植入数量也逐年增加,随着科学技术与发展,起搏器功能和种类如雨后春笋,而永久性起搏器在临床应用
<正>主持人语:以"跨境"作为讨论民族在现代语境中的诸种关系,是现代民族国家(nation state)交给学者的"作业"。因为,就现代国家的历史形制而言,它只有两百年多年的历史。在这