有限集合污损汉字的识别

被引量 : 0次 | 上传用户:betteryear2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
有限集合污损汉字识别是汉字识别中具有重要意义的研究课题,它在汽车牌照字符识别、身份证件字符识别等方面发挥了很大作用。完整的印刷体汉字识别已经取得很好的成绩,但对于有污损的有限集汉字识别,目前还很少有人做这方面研究,所以具有很大的研究空间和实用意义。本文处理的对象是扫描得到的有一定程度污损的汉字,总共一百个样本,主要工作如下:1、汉字图象的预处理,由于光照强度和图像采集的角度不同,扫描得到的汉字图像可能出现大小不一、灰度相差很大等情况,所以需对图象进行平滑、二值化和归一化处理,本系统所选取的实验对象比较清晰,没有太多噪声干扰,所以用邻域(均值)滤波器,采用整体阈值的双峰法二值化,并根据图形的特点,对其实施线性归一化方法。2、字符的特征提取,首先简单介绍一下目前常用的一些特征提取算法,并针对本课题研究的有污损的有限字符集,提出了一种基于象素点八方向长的笔段特征提取算法,在此基础上,提出了基于先验知识的笔段合并算法,最终基本得到汉字图象的笔画。3、在识别阶段,本文采用了双层串行分类器结构,将有限字符集按结构的不同分为三类,即左右、上下、其它三类,并对左右和上下结构的字体以标准部首进行粗分类,以找到待识别汉字所在的子集,在细分类阶段,分三种情况分别在各类子字库中以待识别汉字或部首为基准按汉字信息链表匹配算法进行匹配。本系统的训练和测试样本共一百个,有的测试样本都有一定程度的污染,识别正确率约为92%。
其他文献
作者于2006年4月至8月在新疆喀什莎车县对荒漠过渡带和相邻棉田的蜘蛛群落进行了系统调查,其主要结果如下:1.荒漠过渡带共采集蜘蛛39种,隶属于13科、36属。其中荒漠过渡带蜘
采用干法工艺生产的魔芋微粉其魔芋葡甘露聚糖(Konjac Glucomannan,KGM)含量一般在60-85%范围内,仍然含有少量的生物碱、色素、多酚类化合物及其氧化产物等杂质,其中还含有魔芋固有
本研究在两次大规模调查研究(范围覆盖全国9省市19个城市40企业共1263个有效样本)和两次实验研究(范围覆盖5省市15个城市19家企业共920个有效样本)的基础上,针对员工对组织的
企业信息管理系统在生产、零售、批发、分析研究等各单位的管理运营中,均有广泛应用。开发一套适用的MIS系统,对企业提高运作效率和信息化水平,推进企业管理信息化的普及和发展,
本文研究了基于自动铺带技术的复合材料锥形壳体的成型问题,包括成型锥形壳体中的预浸带的切割模式、铺放成型方法及相关制造系统与软件等基本问题。全文的主要内容如下:(1)
演化硬件是把进化算法与可重构硬件相结合,研制能像生物生命一样,根据环境变化而动态调整自身结构的硬件电路设计方法。演化硬件可大大提高电子系统的可靠性和可用性,对需要
本文针对微型飞行器关键技术之一的动力装置特性进行研究,通过大量试验,得到较完整的特性数据,并提供系统的动力装置匹配方法。首先,本文根据常规螺旋桨气动计算方法,结合低
奏议是中国古代文学散文史上的重要组成部分,西汉奏议更是屡屡为人称道。而引《诗》入文也是我国古代散文创作的常见现象,肇始先秦,在西汉几近最盛。西汉帝王诏令、臣子奏议皆频频出现《诗》中章句,奏议尤甚。因此,本文在第一章概述奏议存录和《诗》学发展的基础上,将西汉划分为前、中、后三个阶段,立足于西汉奏议对《诗经》的引用,逐一分析具体的奏议语境之中对于《诗经》的引用情况,并且根据奏议议论主题的不同对其进行分
区域史、民族史研究的新突破———简评《中国西南文化研究》(第2集)以特定范围区域或地方的历史、人文发展过程作为主要追寻对象的研究,是近年颇取得一些成果的新领域,如已经见书
汽车产业的发展水平在一定意义上是衡量一个国家或地区工业水平、经济实力和科技创新能力高低的重要标志,大力发展汽车产业是我国经济发展的重要战略选择。汽车、摩托车产业