手写女书字符图像切分算法研究

来源 :中南民族大学 | 被引量 : 0次 | 上传用户:ALF123456
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
女书是世界上独一无二的女性专用文字,它主要依靠手工书写的方式,通过母传女,老传少,一代代传承下来。随着女书传人的相继去世,女书的处境十分艰难,亟待信息化保护。脱机女书字符识别技术的研究对抢救和保护女书具有重大的意义,而女书字符切分作为脱机女书字符识别的基础,其准确率直接影响着识别的正确率,对该问题的研究,对于提高识别的系统性能具有十分重要的意义。由于女书的载体众多,且书写风格独特,女书字符图像文本行存在多方向结构,使得文本行提取困难。女书自上而下书写,字符图像中存在上下重叠、上下粘连现象,为女书字符切分带来了巨大的困难,间接影响着后续女书字符信息化处理。本文针对手写女书字符的特点,设计并实现了手写女书字符图像多方向文本行提取方法及女书字符切分方法。论文的主要研究内容如下:(1)针对脱机手写女书字符图像中的文本行呈发散状、弯曲等多方向结构,本文设计并实现了一种基于链接模型的多方向文本行提取方法。该方法首先利用数学形态学操作和最小外接矩形提取女书字符块,并删除图像中的非字符块,然后对字符块构建Delaunay三角网,并根据三个给定的准则计算Delaunay三角网中各边的权重构建链接模型,最后根据链接权重,利用互斥原则搜索出文本行。实验结果表明,该方法能有效提取扇面、布帕等不同载体上女书字符图像中的多方向文本行。(2)为解决女书字符间存在的上下重叠、上下粘连的问题,本文设计并实现了一种基于细化的多步女书字符切分方法。该方法首先利用直方图投影进行预切分,并利用字符平均高度筛选出重叠字符和粘连字符。然后针对重叠女书字符,提出了一种基于背景细化的切分路径搜索方法,解决了上下重叠女书字符的切分。最后提出了一种针对粘连女书的粘连点检测方法,并将粘连女书字符转换为重叠字符进行切分。实验结果表明,该方法能有效地对上下重叠及上下粘连的女书字符进行切分。
其他文献
囊状幼虫病是东方蜜蜂种群减少的主导因素,由于缺乏有效的预警手段,目前只能在发病后进行药物控制,导致蜂产品产量、质量的下降。风险评估是识别某一事件存在风险隐患的有效手段
随着科学技术的飞速发展,数据形式愈来愈趋于多样化,例如图片、语音、指纹等等。对于复杂形式数据的挖掘也越来越重要。科技的发展使得人类越来越渴望找到代替人类工作、思考的
软件技术和经济的飞速发展,使得传统的软件提供模式发生了巨大的变化,产生了SaaS型软件服务提供模式,同时面对网络中急剧增长的需求,众多组织和个人希望快速的切入到这一市场,为此
克隆代码的检测和重构是提高软件的可靠性和质量的重要方法。相对于语法相似的克隆代码而言,功能等价的克隆代码和结构语义相似的克隆代码是较为复杂的克隆代码类型,目前对这两
随着信息科学技术的快速发展和高性能计算机的普及,数字图像处理技术越来越先进,数字图像处理工具也越来越强大,编辑和处理数字图像变得极为容易。数字图像可以被轻易地修改,并使
视频目标检测和目标跟踪技术已广泛地使用于各个领域中。本文对基于非参数核密度估计背景建模和基于均值偏移(Mean Shift)的目标跟踪算法展开研究,提出新的方法以提高目标检测
伴随着信息技术的快速发展,网络成为了人们的一种社交平台,人们的生活、工作及学习也变得越来越网络化,电子邮件作为常用的网络交流工具,尤其是在工作中受到了广泛的应用。但近年
风力发电作为发展最快的新型清洁能源带动了风电技术的发展和广泛应用并促使风电机组的规模不断扩大,由此产生的数据规模也随之扩大。在风电机组处于工作状态时,其中的部件如齿轮箱、轴承等出现松动、磨损、异常等都会产生大量的振动数据,难以满足对海量数据整理、分析、存储需求,而且由于风电机的发电系统和监控设备的多样性,各类设备都产生不同的数据格式或数据类型,大都以数据流的形式输出。因此诸如Hadoop等云计算平
随着动画产业的飞速发展,动画角色往往需要极具个性、夸张等特点的风格化运动。然而,传统的运动捕捉技术仅能采集人体的真实运动,难以满足角色动画的风格化需求。目前,风格化运动
本文首先讨论了压缩传感或压缩感知(CS—compressive sensing/compressed sensing)理论技术中涉及到的内容,有常用的测量矩阵、变换空间中的稀疏表示和常用的图像重建算法;然