联机手写英文单词识别技术的研究与实现

来源 :南开大学 | 被引量 : 0次 | 上传用户:wumin6230
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文字识别技术一直以来都是模式识别领域中的一个重要课题。基于不同的书写方式,不同的识别对象,识别方法也不尽相同。在充分考察目前英文单词识别技术发展现状的基础上,本文设计了一种先对单词进行分割,然后再进行字母识别,最后对字母识别结果进行重组的联机手机英文单词识别系统。   本文首先提出了一种基于规则的联机手写英文单词分割的方法。该方法首先将单词的采样点的所有局部最低点作为潜在分割点,然后抽取每个潜在分割点的五个属性特征,最后通过学习到的规则对这些潜在分割点进行编辑(移动、删除或保留)获得最终分割点,由此将单词分割开来。   字母识别引擎是用反向传播神经网络架构而成的。在前人已经进行的研究基础上,为字母设计了新的特征及目标向量,并进行了大量的训练,最终得到一个识别效果比较好的神经网络。   单词分割算法的过分割现象是不可能避免的,因此在识别过程中必须把相邻笔划进行合并。本文设计了一棵组合树解来解决穷举所有组合方式的问题。对于单词的每一种重组方式,首先将它的每一个笔划段分别送入字母识别引擎进行识别,然后再对识别引擎给出的所有候选字母进行组合。为了解决组合单词数目过于庞大的问题,本文又在实验的基础上提出了一些用于提高识别率和识别速度的剪枝方法。   在UNIPEN数据集上进行了识别实验,正确识别率达到86.6%,平均每个英文单词的识别时间为0.85秒。实验结果表明:本文所提出的方法是行之有效的。
其他文献
数字水印以数字作品内容保护为主要宗旨,已经被广泛的研究。近年来,学者也提出许多不同的算法。鲁棒水印嵌入容量虽然较低,但却能抵抗各种非恶意的篡改。在一些应用场合中,出于对
近年来,随着移动定位和无线网络技术的发展,人们可以更加方便地测定自己的地理位置,一种新的应用服务--基于位置的服务应运而生。人们为了获得基于位置的服务需要将自己的精确位
近年来,随着各大高校每年招生数量的逐渐增多,高校宿舍管理工作人员的工作量越来越大,效率却越来越低,如何充分利用Internet和计算机技术为高校的宿舍管理工作以及学生的日常生活
标签推荐是一个新的研究方向,其旨在为目标资源自动添加标签作为描述信息,来缓解标签空间噪声数据增多、标签指代内容模糊等现象。目前,标签推荐方法主要有基于内容的方法、基于
随着信息时代的到来,社会对数据处理的需求越来越复杂,越来越多样化。传统的关系型数据及关系型数据库已经渐渐不能够满足现代数据,尤其是结构化半结构化数据的数据描述需求与数
贝叶斯网络检索模型是信息检索中概率模型中的一种。合理使用术语关系扩展该检索模型可以有效地提高检索性能。本体是共享的概念模型的形式化的规范说明,具有概念层次结构和
随着信息化技术的迅速发展,数字出版已经显示出它特有的优势。但数字作品可以几乎零成本复制和传播也带来了版权很难得到保护等问题。于是数字版权管理(Digital Rights Manage
本文基于微软.NET平台开发了一个远程网络考试系统。该系统可以应用在多种远程教育考试上,可以基本上实现无纸化和自动化考试模式。系统不仅可以应用在局域网环境下,还可以应用
数字媒体是指以二进制数的形式记录、处理、传播、获取信息的载体。数字版权管理指的是数字媒体出版者用来控制数字媒体使用权所采用的一项技术。同其他的加密技术不同,数字版
随着信息化时代的到来以及企业对办公自动化的需求不断加强,企业内部根据不同部门的职能根据各自需求建立了多个企业内部的应用系统,其中员工考勤系统可以使繁杂重复的手工记录