自由手写汉字识别方法研究

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:woshiwl0000
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
手写汉字识别因其重要的理论意义和潜在的应用价值,吸引了大量的研究者。在有限制自由书写的数据集上,手写汉字识别已经取得了较大的成绩,但针对自由手写汉字识别的研究较少且识别性能偏低,限制了字符识别应用的进一步开展。为了克服当前手写汉字识别技术存在的一些不足之处,例如,预处理方法应对形变能力不足以及和特征提取方法联系不够紧密、分类器集成策略缺乏针对性、相似字的区分能力不足等,本文主要研究了如何设计一个应对字符形变能力较强且和特征提取联系更加紧密的预处理方法;如何针对手写汉字识别设计简单有效的分类器集成方法;如何利用相似字的关键区域结构信息来更好的区分相似字。本文研究工作包括以下三个部分:   ①针对预处理方法应对字符形变能力不足以及和特征提取方法联系不够紧密的问题,本文提出了基于视觉词密度(VWD)的非线性归一化方法。该方法同时考虑归一化后样本的类内和类间方差,弥补了传统归一化方法仅考虑类内方差的不足;同时,在词典密度学习的过程中用到了特征提取方法,从而使得归一化和特征提取的联系更加的紧密,为后续的分类识别打下良好的基础。在自由手写和有限制自由手写汉字数据集上的实验结果表明,本文提出的方法在分类性能上优于常用的非线性归一化方法。   ②手写汉字识别问题具有类别集大、训练样本少等特点,现有的很多分类器集成方法很难直接应用到该问题上,针对该问题的特点,本文提出了基于快速自产生投票(FSGV)的手写汉字识别方法。首先,利用本文提出的快速自产生方法产生一个测试样本集合;然后,利用一个基分类器去识别这个测试样本集合中的样本;最后,对这些识别结果进行加权投票给出最终识别结果。另外,为了提高产生样本之间的互补性,本文通过贪心法学习得到一个较小的但互补性较好的产生参数集合,使得投票的速度和分类性能都有进一步的提升。在自由手写和有限制自由手写汉字数据集上的实验结果表明,本文提出的方法是实用和有效的。   ③在相似字区分问题中,基于两类线性判别分析的相似字区分方法是较为常用的方法。这类方法针对线性可分的相似字区分效果较好,但是对于自由手写汉字,相似字之间往往是线性不可分的。针对此问题,本文提出了基于自适应关键区域分析(ACRA)的相似字区分方法。该方法充分考虑到了关键区域的尺度和位置的可变性以及可能产生的各种形变,达到自适应测试样本的目的。同时,针对训练样本少导致的AdaBoost方法泛化性能较差的问题,提出了多列AdaBoost方法。在自由手写汉字数据集上的实验表明,本文提出的ACRA方法的识别性能优于常用的相似字区分方法。
其他文献
模式分类是机器学习和模式识别的核心问题,而特征表示和分类器设计又是模式分类的关键步骤。大量的特征提取方法以及分类器模型被相继提出并在实际问题中得以广泛应用。然而绝
基于视觉的定位方式是机器人领域应用较为普遍的定位方式之一,目前已得到了国内外众多科研工作者的广泛重视,具有较为广阔的应用前景。基于普通视觉的定位方式视野狭窄,路标检测
半监督学习是一种应用驱动而产生的机器学习方法,已经成为人工智能和模式识别领域的研究热点之一。作为该领域的主要分支,半监督聚类将给定的少量监督信息引入最优聚类的搜索过
对于脱机手写中文文本识别,字符切分是其中一个十分重要的部分。由于在字符识别之前不能准确地切分,往往采取过切分方法,即将字符串切分成基元片段,然后结合字符识别和上下文动态
电视节目结构化与摘要技术是多媒体内容分析领域研究的主要问题,在视频数据的浏览和检索领域有广泛的应用价值和商业价值。虽然经过多年的研究,电视节目结构化与摘要技术已有了
机器人打乒乓球是机器人作业的一种较高形式,也是机器人领域的前沿课题和难题。目前国内外已有多家单位开展相关研究,研制的原型样机基本实现了非旋转球的简单推挡动作。打乒乓
在机器人应用领域,视觉引导是控制机器人移动作业的关键技术和重要途径。对于打乒乓球机器人而言,视觉系统是其实现自我感知与环境交互,并捕捉环境中感兴趣目标的重要手段。基于
命名实体歧义是指同一个实体指称项在不同上下文环境中对应不同真实世界实体的语言现象。实体歧义问题给信息处理领域的很多任务带来了严重问题,信息检索和抽取、知识工程等任
目前,机柜已经成为计算机行业、通信行业和互联网行业中不可缺少的用品。机柜是通过电源机柜进行供电的。机柜中的电子设备能否安全、可靠、稳定的运行取决于电源机柜是否能
在实际应用中,仅利用机器人的重复定位来完成结构化环境中的任务已不能满足市场的需求,提高机器人的绝对定位精度使机器人能够自主完成任务是当今劳动成本高、生产竞争激烈的市