论文部分内容阅读
蒙文输入法的研究开始于上世纪八十年代初期,主要集中在键盘输入上,对蒙文文字识别的研究非常少。针对这种情况,我们提出研制一套多字体印刷蒙文识别系统,为蒙文提供了一种快速、高效、智能的输入方式,这对继承和发展少数民族文化、促进少数民族地区社会进步都具有十分重要的意义。本文在总结前人研究成果的基础上,进行了诸多改进和创新。主要研究内容包括: 1、蒙文文本图像的自动倾斜检测。提出了一种基于最小二乘法的蒙文文本图像的倾斜检测方法:先找到图像中的文字连通域,然后依据连通域的上下位置进行文字列的合并;对同一列中的每个连通域以它们的质心为参考点,使用最小二乘法进行直线拟合,可以得到倾斜角度。 2、蒙文文本图像的版面分析。提出了一种基于连通域的蒙文文本图像的版面分析方法,它是一种“自底向上”与“自顶向下”相结合的方法,先搜索版面中的连通域,然后依据连通域的大小进行聚类分析,可以得到不同类型的版面元素,最后把文字连通域合并成文字列和文字块。 3、蒙文字母切分方法的研究与实现。提出了一种基于主干线的蒙文字母切分方法,为进行特征提取和特征匹配提供前提条件。 4、蒙古文字特征选择。在充分分析印刷体蒙古文字特点的基础上,找到了适合进行蒙文识别的多个特征,包括:粗分类特征和细分类特征。 实验证明,以上关键技术的实现,使得印刷体蒙古文字识别系统的性能和