拓扑结构特征提取及其在脱机手写数学符号识别中的研究与应用

来源 :山东师范大学 | 被引量 : 0次 | 上传用户:coolcool1234567
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文字是人类信息交流的主要载体之一。随着计算机信息技术的高速发展,使用计算机处理并识别文字信息也就成为了一个非常重要的研究和应用领域。光学字符识别OCR(Optical Character Recognition)是在20世纪逐步发展起来的一门自动化技术。脱机手写体字符识别是模式识别的一个重要分支,它涉及人工智能、图像处理、信息论、数字信号处理、模糊数学、计算机等学科,是一门综合性技术。在信息处理、机器翻译、办公自动化、人工智能等高技术领域,都有着重要的实用价值和理论意义。需要录入到计算机中的非纯文本信息是各种各样的,如大规模的原始数据资料、税务单据、会计凭证、金融票据、传统信件以及学生试卷等。如果采用手工输入的方式,就会显得非常麻烦而且工作效率非常低。尽管识别文字及数字的OCR技术已经非常实用,但数学符号的识别仍然不够理想。而数学符号对科学研究人员、数学工作者乃至普通大众都是很重要的。针对这一问题,本文进行了必要的分析,分别将脱机手写数字和脱机希腊字母进行了预处理并自主建立了手写数学符号样本库,然后对其进行了特征提取以及分类识别实验。本文对手写数学符号识别技术进行了研究和探讨,试图寻找属于某种范围的(比如:学生试卷学号、日期以及数学试卷中最常见的希腊字母,MNIST手写数字库)特征提取以达到很高的识别率。提出了一种通过拓扑特征构造来进行特征提取的方法。该方法以图像预处理为基础,最后采用分类树的方法进行识别分类。在特征提取方面,本文提出了一种拓扑结构构造方法,对数学符号构造了拓扑特征。人类字符认知的常识表明,拓扑结构在字符尤其是单个字符的辨识中起着首要的决定性的作用。由于原始图像所含对象本身的拓扑结构所包含的信息是很有限的,不能够反映出对象或其某些部位的弯曲方向、程度、分支关系等特征,而这些特征对于区分对象来说又是非常关键的。为此,本文提出如下的图像对象拓扑构造方法:在原始图像对象的某一侧或某几侧增加几列或几行像素,这些新增加的像素与原来的图像对象构成了新的拓扑结构,然后通过对新拓扑结构的连通区域的计数与位置计算获得识别特征。这些新构成的拓扑结构所含的连通(环状)区域能够体现出对象或其某些部位的弯曲方向、程度、分支关系等特征,从而可以为分类和识别提供有价值的依据。在预处理方面,本文用采集来的本科学生试卷的学号和日期以及学生高等数学试卷中的最常用的希腊字母作为样本,对其采用了传统的预处理过程,包括图像的灰度化、单字符切分、二值化、字符平滑、去除干扰、单字符归一化。最后将预处理后的字符图像仿照MNIST手写数字库建立了一个手写数学符号库,其中留有与MNIST手写库同样的边缘背景。分类识别采用了分类树的方法。实验表明,该方法不仅运算速度较快,而且分类效果好。识别系统对自主采集建立的手写数学符号图形库进行了分类识别实验,手写数字最好识别率为93.5%,误识率为6.0%,拒识率为0.5%,手写希腊字母最好识别率为93.7%,误识率为5.4%,拒识率为0.9%。实验表明,我们所提出的方法有较好的可行性,并得到了较高的辨识率。
其他文献
学位
无线传感器网络是20世纪90年代发端的一项新兴技术,它综合传感器、嵌入式计算、通信、计算机等技术,通过无线通信实现自组织,分布式自治网络系统,已成为国内外IT领域的研究热
随着网络的迅速发展和互联网应用的普及,网络已成为人们日常工作生活中不可缺少的信息承载工具。网络技术的迅猛发展使人们对网络技术日益依赖的同时,也使得网络安全问题突显
学位
学位
云环境中同驻虚拟机间由于共享物理资源,使得一些恶意云用户通过探测、分析共享资源的信息来隐蔽地获取其他云用户的私密信息,引发侧通道攻击威胁,从而使云环境中的同驻虚拟
随着我国经济的高速发展,城市化的步伐加快,中国的许多大中城市开始出现城市蔓延。这主要是由于城市用地的快速扩张和无序开发引起的,因此中国城市化面临的一个主要问题就是
工作流技术以其在实现业务流程的自动化上的优势而成为一个新兴技术亮点。业扩报装系统是电力企业安全稳定运行的重要保证。在对工作流理论和标准进行深入研究的基础上,本文
三维游戏技术目前已经广泛应用于各种研究领域,如虚拟现实系统、汽车模拟训练系统及军事仿真系统等。它推动诸多领域的发展,并已经成为当今的研究热点。基于三维游戏技术的重
电脑横机是一种由电脑控制的自动化程度很高的横编针织机械,主要用于羊毛衫等针织服装以及工艺品的编织制造行业。   电脑横机控制器是整个电脑横机系统最核心的部分,合理的