基于无切分策略的脱机手写体数字串识别

来源 :南京理工大学 | 被引量 : 0次 | 上传用户:zxjz520
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
脱机连续手写体字符识别(Cursive Script Recognition CSR)是字符识别(Optical Character Recognition, OCR)研究领域中比较困难的问题之一,传统的依赖于精确分割的单字识别方法,是在识别之前有专门的切分阶段,把识别对象由文本或单词切分到字符,针对字符进行特征对比。由于切分识别不能很好的解决自由书写字符(如手写汉字、阿拉伯数字)的准确分割问题,使得其对连续手写字符识别的识别变得很困难,识别率比较低。而基于无切分策略的系统,不需要显式的切分阶段,而是运用边识别边切分或者叫识别和切分合而为一的策略。隐马尔科夫模型(Hidden Markov Model, HMM)是一种用参数表示的用于描述随机过程统计特性的概率模型,是一个双重的随机过程,一直被应用于语音识别领域。近年,许多识别领域的研究者正在以各种方式将HMM用于字符识别。本文中简要讨论了字符识别以及HMM的基本理论,发展动态和基本处理方法;随后在HMM理论基础之上进行了单个数字识别的实验,此实验的训练方法为Baum-Welch重估算法,是在语音识别中应用的一个相当经典和成熟的算法,解码用的是Viterbi算法;接着提出了一种基于嵌入式隐马尔科夫模型(Embedded Hidden Markov Model EHMM)的连续手写体数字识别方法,即在训练和解码阶段,将单个字符模型嵌在一起。连续字符模型的参数估计采用的是嵌入式Baum-Welch重估算法,解码识别采用的是符标通行算法(token-passing algorithm),此算法是针对连续字符的特点,在Viterbi算法的基础之上衍生出来的;最后给出了实验结果并对结果进行了分析。
其他文献
进入21世纪,我国逐渐步入老龄化社会,老年人的身体健康问题得到了越来越广泛的关注。而且由于现代社会很多年轻人都外出工作,导致许多老人都独自生活,因此解决居家老年人的健
足球机器人是一种能够在已知场地环境中,在相应竞赛规则和多机器人动态竞赛环境下,实现无碰撞自动找球、带球、射门等一系列技术动作,可自主进行足球比赛的一种机器人。在足
ZigBee是一种为低成本、低功耗和低速率无线通信市场而生的技术。其丰富而便捷的应用正吸引着越来越多的人加入其中。基于ZigBee的无线传感器网络是一种中短距离、低速率的无
星敏感器作为一种天文导航姿态测量器件,因其具有较高的测量精度、无累积误差、自主性好等优点而被广泛的应用在航天器中,成为了航空、航天以及军事领域备受关注的研究对象。
三维感应测井是一种新型的油气储层探测系统,它主要应用于各向异性油层的勘探中,可直接测量水平电阻率和垂直电阻率,是人们认识地层特性,进行油、气储层评价的有效方法。本文
火灾是严重威胁人们生命财产安全的常见灾害之一,研究火灾的探测技术,实现对火灾的实时探测与预警极为重要。传统的感温、感烟等火灾探测方法在大空间、多干扰等场合下已经不
混凝土泵车由于其灵活、方便、高效等特点已成为建筑行业的重要工具,国内基础设施建设的持续发展,带动了国内商品混凝土行业的飞速发展,也为混凝土泵车提供了更大的市场空间,
UUV在浅海环境执行任务的过程中,通过前视声纳探测局部环境信息,并以此为依据进行在线航路滚动规划与避碰响应。由于浅海物理环境与声场环境的复杂性,前视声纳的探测信息常受
全垫升气垫船由空气静压力支撑,采用空气螺旋桨提供推力,航行时完全脱离水面,遭到水的阻力比普通船小,是典型的水面快船之一,具备良好的两栖性和耐波性。因为气垫船航行存在