脱机中文手写字符串切分方法研究

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:bad_47
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
对于脱机手写中文文本识别,字符切分是其中一个十分重要的部分。由于在字符识别之前不能准确地切分,往往采取过切分方法,即将字符串切分成基元片段,然后结合字符识别和上下文动态地组合基元片段得到字符。过切分一般通过连通块标记和粘连字符切分来实现。粘连字符切分的目的是保证在争取切分开粘连区域的前提下,尽可能少的切分。这是一个研究的难点,虽然已有一些前人的相关研究工作发表,但仍然有很多遗留问题未能解决,值得进一步进行深入研究。本文通过对于脱机粘连手写字符串过切分方法的深入研究,有效提高了手写字符串的切分和识别正确率。本文的主要贡献如下:   (1)建立国内首次公开的粘连字符串数据库。我们利用已经标记好的脱机手写文本数据库CASIA-HWDB,抽取出其中的所有粘连字符串,建立了一个标注好的粘连字符串数据库CASIA-HWDB-T。该数据库总共包含56,469个粘连字符串,其中大部分是单粘连字符串,余下的小部分是1,818个多粘连字符对。   (2)提出一种基于字符轮廓匹配的过切分算法。该方法的主要特点在于我们使用动态时间折叠(Dynamic Time Warping,DTW)技术,来找到轮廓特征点相应的对面轮廓最佳匹配点。这样即使在粘连区域附近不存在上轮廓或者下轮廓角点的情形下也能生成切分线段。在大规模粘连字符串数据库上的实验结果表明该方法能够正确切分开绝大部分粘连字符串(即很高的召回率)。   (3)提出一种结合前景骨架分析和字符轮廓分析的过切分算法。相比较于轮廓分析,前景骨架分析有利于更准确地找到正确切分点。同时我们基于轮廓分析的切分点的可见性度量能有效地过滤掉冗余切分点。在大规模粘连字符串数据库上的实验结果表明,该方法能够正确切分开大部分粘连字符串,而冗余切分点比例是比较适中的。   (4)提出一种结合规则和学习过滤的过切分算法。基于学习的过滤可以克服以往完全基于经验规则过滤冗余切分点时不够鲁棒的缺陷。我们在标记的正确切分线段和冗余切分线段样本上,提取切分线段相关的多维几何特征,训练线性分类器(Linear Discriminant Function和Linear Support VectorMachine),并将分类器输出通过Sigmoid变换转化为置信度概率,然后根据单个切分线段的置信度和相邻切分线段的置信度对比去除冗余。实验结果表明,该方法能够取得比较好的切分点检测召回率和精度的折中,并且有助于提升字符串识别性能。   (5)提出一种基于隐马尔可夫模型(Hidden Markov Model,HMM)的切分线段过滤算法。HMM是一种一维序列模式识别的方法,能更好地描述前后切分线段的相关性,来从整体上判断冗余切分线段。在大规模粘连字符串数据库上的实验结果表明了该方法的可行性。
其他文献
多弧离子镀是在真空电弧和离子镀技术基础上发展起来的一种新式镀膜技术。近些年,随着其工艺的逐渐完善,以其离化率高、散射性好、膜层致密以及附着力强等优点,在冶金、机械加工
机器人作为20世纪人类最伟大的发明之一,代表了当今社会最先进的智能控制技术。仿人机器人作为系统结构最复杂、集成度最高、与人类最为相似的一类机器人,代表了最先进的机器
论文在分析了药芯焊丝拉丝机的机构、特点以及在拉制过程中影响焊丝张力因素的基础上,建立了各机架分部数学模型、机架间张力的数学模型和整机的数学模型.并在此基础上,分析
城市交通系统与城市发展息息相关,对人类文明演化起到不可替代的支撑作用。但近年来,随着大量人口向城市集中和城镇化进程不断加速,交通压力越来越大。而旧有的城市交通改善方法
该文对工业CT局部找描的重建算法及其在计算机上的实现进行了研究.论文介绍了研究背景,通过比较分析,定出了将平行束扫描方式下的局部图象重建作为课题的研究内容.
多任务学习用于同时学习多个相关任务,通过联合学习,它既保持了任务间的差异性又充分利用其相关性,从而从整体上提高所有任务的学习性能。多任务学习引起了很多学者的关注,基于不
基于图像的物体定位是计算机视觉领域的一个重要内容,在诸如机器人导航和虚拟现实等领域有重要的应用价值。本文对基于点对应的物体定位方法进行了比较系统的研究,包括多解性,解
模式分类是机器学习和模式识别的核心问题,而特征表示和分类器设计又是模式分类的关键步骤。大量的特征提取方法以及分类器模型被相继提出并在实际问题中得以广泛应用。然而绝
基于视觉的定位方式是机器人领域应用较为普遍的定位方式之一,目前已得到了国内外众多科研工作者的广泛重视,具有较为广阔的应用前景。基于普通视觉的定位方式视野狭窄,路标检测
半监督学习是一种应用驱动而产生的机器学习方法,已经成为人工智能和模式识别领域的研究热点之一。作为该领域的主要分支,半监督聚类将给定的少量监督信息引入最优聚类的搜索过