【摘 要】
:
脱机汉字识别是模式识别的一个重要研究领域,是汉字信息处理的重要接口技术。经过几十年的研究,在印刷体识别、银行支票、邮政系统等方面取得了重要成果。但在整个OCR领域,尤
论文部分内容阅读
脱机汉字识别是模式识别的一个重要研究领域,是汉字信息处理的重要接口技术。经过几十年的研究,在印刷体识别、银行支票、邮政系统等方面取得了重要成果。但在整个OCR领域,尤其是自由手写体领域,目前在提高识别率方面还存在相当大的困难,成为该领域最具挑战的课题。论文做的主要工作如下:首先,对图像进行了预处理,去除与文字无关的信息,如色彩信息;针对一般文本图像,本文设计了一种算法,来获取文字前景图像。从效果上看,一方面,去除了较多的背景信息,另一方面,较好地保留了文字的信息。其次,综述了用于单个手写体汉字识别的特征,如轮廓特征、方向线素特征、网格特征、背景特征等。重点介绍了方向线素特征的提取方法以及基于统计的网格特征的研究成果,并分析了这些特征在文字识别方面的优劣性。然后对细化算法的分类进行了深入的探讨,如可以分为基于象素判断的算法和基于边缘侵蚀的算法。本文提出了一种基于保留骨架点的并行算法,该算法对图像细化有较好的效果。再次,对多行手写体识别的特点进行了研究,是文章的主要的研究成果。首先提出了连通分支的标记方法,由于该方法处理的数据量大,文章先对文本图像进行了行切分的预处理,有效减少了数据量,在得到行后,由于文字部件结构复杂,又提出了一种基于连通分支合并和分解的方法,得到了较佳的处理效果。最后,针对手写体普遍出现粘连,重叠的现象,综述了前人的成果,如角点检测算法,基于字符图像背景的切分算法。并从另一角度,即把整个文字图像看作一个图,对图像的切分看作是图到子图的断裂,从而最终实现粘连字符的切分。
其他文献
在造船工业中,逆直线法被广泛应用于肋骨加工中。所谓逆直线法就是先在肋骨的原材料上画出一定的形式曲线,然后将肋骨弯曲至所画的曲线为直线时为止,便弯曲成功。数控冷弯机
在物理、力学、化学、生物学和经济学等领域,很多的模型都是非线性偏微分方程。为了便于对物理现象以及其他现象的描述和理解,对非线性偏微分方程求解变得越来越重要。浸入K(3,
数学是人们生活、工作和学习中必不可少的工具,它也为其他学科提供了语言、思想和方法,可谓一切重大技术发展的基础。小学数学,作为小学课程中非常重要的学科之一,对学生的成
在这篇论文中,我们主要讨论两个问题:具非线性主部的耦合弦振动方程的爆破解和带有时变的非线性局部阻尼的变系数波方程的柯西问题的能量衰减。对于第一个问题,我们主要应用能量
北京师大女附中成立至今,一直是国人敬仰的著名女校,培养出不少杰出的巾帼英豪。1935年,在如火如荼的“一二·九”运动中,有三个当时在该校读书的年轻女孩献身革命,在斗争中
柔性,可解释为柔韧性、可曲性、弹性、适应性、机动性。与柔性相对的是刚性、坚硬、僵化、死板、严格、硬度。我们把在处理不确定优化问题时,引入人的主观因素或允许约束条件
科学计算可视化技术在医学领域中正得到越来越广泛的应用。可视化技术是由一系列二维图象重构出三维模型,并在计算机上显示出来。这大大加强了医生的诊断能力,提高了医学诊断
Lattice Boltzmann Method(LBM)是一种从介观角度来进行数值模拟的方法,自被提出后,发展十分迅速。该方法在能保证动量守恒和能量守恒的前提下,能够从介观出发推导出宏观流体力学
分形插值的概念是在1986年由美国数学家Barnsley首先提出,它是一种新的插值方法,它在图象压缩、非光滑曲线和曲面的拟合等研究领域中显示出了独特的优越性,取得了巨大的成功。Ba