论文部分内容阅读
女书是世界上独一无二的女性专用文字,它主要依靠手工书写的方式,通过母传女,老传少,一代代传承下来。随着女书传人的相继去世,女书的处境十分艰难,亟待信息化保护。脱机女书字符识别技术的研究对抢救和保护女书具有重大的意义,而女书字符切分作为脱机女书字符识别的基础,其准确率直接影响着识别的正确率,对该问题的研究,对于提高识别的系统性能具有十分重要的意义。由于女书的载体众多,且书写风格独特,女书字符图像文本行存在多方向结构,使得文本行提取困难。女书自上而下书写,字符图像中存在上下重叠、上下粘连现象,为女书字符切分带来了巨大的困难,间接影响着后续女书字符信息化处理。本文针对手写女书字符的特点,设计并实现了手写女书字符图像多方向文本行提取方法及女书字符切分方法。论文的主要研究内容如下:(1)针对脱机手写女书字符图像中的文本行呈发散状、弯曲等多方向结构,本文设计并实现了一种基于链接模型的多方向文本行提取方法。该方法首先利用数学形态学操作和最小外接矩形提取女书字符块,并删除图像中的非字符块,然后对字符块构建Delaunay三角网,并根据三个给定的准则计算Delaunay三角网中各边的权重构建链接模型,最后根据链接权重,利用互斥原则搜索出文本行。实验结果表明,该方法能有效提取扇面、布帕等不同载体上女书字符图像中的多方向文本行。(2)为解决女书字符间存在的上下重叠、上下粘连的问题,本文设计并实现了一种基于细化的多步女书字符切分方法。该方法首先利用直方图投影进行预切分,并利用字符平均高度筛选出重叠字符和粘连字符。然后针对重叠女书字符,提出了一种基于背景细化的切分路径搜索方法,解决了上下重叠女书字符的切分。最后提出了一种针对粘连女书的粘连点检测方法,并将粘连女书字符转换为重叠字符进行切分。实验结果表明,该方法能有效地对上下重叠及上下粘连的女书字符进行切分。