脱机手写体汉字识别关键环节的研究

来源 :北京科技大学 | 被引量 : 6次 | 上传用户:cty810
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
脱机手写体汉字识别是模式识别研究领域中的难点,但是由于脱机手写体汉字识别有广阔的应用背景(如金融表单自动处理、自动阅卷等),并且囊括了模式识别领域中的所有典型问题,如特征选择、分类器选择以及样本集选择,因此对于它的研究具有深刻的理论意义和实用价值。本论文的主要工作及创新点如下:①提出基于矩特征和弹性网格技术的串行和并行特征融合策略。矩特征提取的是汉字图像的全局特征,尽管这种特征具有优秀的特征表达能力,并且抗噪声、抗变形能力很强,但是它对相似字的识别率不高。弹性网格方法提取的是汉字图像的局部特征,尽管它能更有效地反映汉字的结构细节,但是抗噪能力差。因此,将这两种特征向量有机结合,不仅能同时兼顾手写体汉字的全局和局部特征,而且具有很强的分辨能力。②提出基于多小波正交外壳扩展和多分辨率匹配策略的手写体汉字识别系统。通过多小波变换和正交外壳扩展得到的特征向量对于手写体汉字图像的位移、大小和旋转变化不敏感,而且所采用的多分辨率匹配策略与人眼观察事物的方式相似,能够快速准确地识别手写体汉字样本。③提出一种基于两分法和GLVQ算法的动态单模板字典制作方法和一种基于特征向量分布的多模板字典制作方法。其中,多模板字典的自学习功能能够有效提高整个系统的泛化能力。④分别针对小样本集和海量样本集手写体汉字,提出基于支持向量机的多类分类策略,所得的分类器不仅识别率高、泛化能力强,而且有效解决了多类分类问题。为了进一步提高分类识别的速度,本文将神经网络多类分类方法与最小二乘支持向量机算法结合,对大样本集手写体汉字进行识别,取得了很好的识别率和识别速度。论文的研究成果为脱机手写体汉字识别提供了新的思路和方法,为今后的研究和实际应用奠定了良好的基础。
其他文献
随着Internet技术的日益普及和广泛应用,互联网上可供直接使用的服务日趋丰富,社会对软件的开发过程提出了更高的要求和期盼,如业务的无缝集成,应用系统的敏捷开发,面向特定
在《圣经·旧约》里,神常说到他自己是丈夫,他的子民是妻子。在何西阿和以西结等先知书里,上帝借先知之口以丈夫的口吻控诉了当时的犹太人生活混乱败坏、纵欲行淫、不守圣约
出于节约社会建设成本的考虑,希望对地理信息资源能够实现共享和增值。这对地理信息系统在网络化、标准化、共享和互操作等方面提出了更高的要求。服务作为一种自包含、自描
在“联邦德国BSA1400H-E混凝土泵分配机构的结构与运动浅析”一文中,本文作者已经从运动学的角度,对分配机构S形管阀的运动特性做了比较详尽的分析和说明,本文试图在这一基础
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
电阻抗断层成像(Electrical Impedance Tomography, EIT)是利用生物体内部组织的电特性参数(电阻率,电导率等)及其变化,对生物体表面施加安全激励电流,同时测量生物体表面的电压信
目的研究基于“靳三针法”以指代针点穴推拿治疗膝关节骨性关节炎的疗效。方法采用数字随机法将60例膝关节骨性关节炎患者分为对照组和治疗组,各30例。对照组给予传统推拿治
虚拟现实是发展到一定水平上的计算机技术与思维科学相结合的产物,它的出现为人类认识和改造世界开辟了一条新的途径。虚拟现实技术以其实时三维空间表现能力、人机交互式的
文章选取了七个代表点方言,来比较温岭方言语音的内部差异。其中有些语音差异既是地域上的差异,同时又是新老派之间的差异。内部差异主要涉及分尖团、侯韵字的读音、果开一见
针对骨骼医学图像的计算机后处理技术可以改善图像观察效果、实现智能辅助诊断,进而推动相关疾病影像学诊断技术的发展和完善。本文首先综述和分析相关技术发展现状,进而针对