脱机手写体汉字切分算法研究

来源 :中南民族大学 | 被引量 : 0次 | 上传用户:cscec83
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
脱机手写体汉字切分是脱机手写体汉字识别的基础,其准确率直接影响识别的正确率,该问题的研究对提高识别的系统性能具有重要的意义。本文以脱机手写汉字为研究对象,对汉字投影切分算法的相关问题进行了研究,提出了改进的切分方案并对方案进行了实现,主要工作和创新如下:1)在手写体汉字的书写过程中,会出现字符粘连现象,该现象一直阻碍着手写体汉字的切分准确率的提高。针对上述问题,本文提出了基于多阈值和多切分策略的间隙切分算法。在阈值选取上,该算法采用多个的空隙阈值分别进行切分,最终选取切分效果最优的切分方案;在切分策略上,采取多步切分策略,对过疏远或者过紧密的字符串分阶段进行处理。实验证明,较传统的投影切分算法,该算法的切分准确率有了一定的提高。2)在基于多阈值和多切分策略的间隙切分算法的基础上,本文通过对影响切分准确性的若干因素进行研究,加入了标点符号切分块的标识、非规范性笔画的修正、各切分块的块长统计等处理,提出了基于极小阈值和曲线拟合的垂直投影汉字切分算法。该算法针对多阈值处理过程繁杂且不够客观的问题,使用极小阈值进行切分,并制定了相应的后期合并策略;针对阈值法寻找切分点的不确定性问题,在行切分和字切分的再切分阶段,采用曲线拟合方法寻找切分点。与一般的投影切分算法相比,该方法在一定程度上提高了切分正确率,并且适用性更广。
其他文献
数据挖掘一直是一个非常活跃的研究领域,其成果被广泛应用于经济,管理等领域,有力的促进了人类社会的发展,给经济和社会的发展带来了巨大的效益。关联规则数据挖掘是数据挖掘研究
WSN (Wireless Sensor Network,无线传感器网络)中的节点如何部署、如何调度,对整个网络的健壮性、可靠性以及生存时间都起到关键性的影响。所以WSN的覆盖问题是当前的研究热
行业环境的瞬息万变为企业带来了新的创建或破坏价值的可能性,企业信息化领域如何快速重构已经成为重要的一个议题。业内已有诸如TOGAF、Zachman等著名的企业架构框架,为企业信
目前,随着城市化进程的快速发展,人口的大量增加,城市交通问题特别是交通阻塞问题变得日益严峻,智能交通系统也越来越受到大家的广泛重视,已成为世界交通系统的发展趋势。智
进入新世纪以来,随着“数字地球”、地理信息系统等地理信息载体的研究兴起,使得对地理信息的表达由二维形式变成了三维形式。地形建模作为上述地理信息载体的基础技术,对它的研
随着网络在民用和军用领域的普及应用,如何对网络进行性能测试已经成为一个重要的研究课题,其中关键技术之一是如何对测试结果进行有效的自动化处理。在复杂测试场景中,由于测试
电子游戏是当今一种非常风靡的娱乐方式。电子游戏技术的发展往往伴随着计算机技术水平的不断更新。在以往的几年内,游戏中震撼的音效、精致的画面是吸引游戏玩家的重要因素,玩
现代互联网技术迅猛发展,在人们的日常生活和工作中网络的作用日益凸显,尤其随着企业、校园等局域网(LAN)内部信息量的增加,人们发现准确高效的获取局域网内的相关信息变得困难,
在商业计算机游戏中,路径搜索的性能直接影响玩家的感受及其对游戏的满意程度。并且游戏中的路径规划常常受到计算机内存和CPU资源的限制。在动态性环境中,角色必须对随时可能
堆栈处理器由于其快速的中断处理能力、极强的过程调用能力、代码尺寸小等优点,一直应用于工业控制和航空航天领域中。自堆栈处理器诞生以来,ALGOL、FORTH这两种语言一直作为堆