复杂背景下女书字符二值化分割算法研究

来源 :中南民族大学 | 被引量 : 0次 | 上传用户:keaiyuyu66
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
女书是世界上最具性别意义的文字,这种由女性创造、女性使用的文字从文化层面上反映了女性的集体智慧,是一种非常珍贵的非物质文化遗产。女书文献主要依靠手工抄写的方式传承,而随着女书传人的相继去世,女书文献的收集和整理变得更加困难,女书文化濒临消失。由于年代久远,不同载体上的女书字符图像多数背景复杂,且不易提取和分割,这个问题严重影响了后续字符切分和识别等信息化处理的质量和效率。针对此问题,本文将脱机手写文字分割技术应用到女书文献的信息化上,进一步推进女书这一宝贵的中华民族文化基因的传承和发扬。本文首先讨论了图像分割中常用的二值化算法,分析了这些算法在图像分割应用上的优点,同时也指出了算法中存在的问题。接着,本文重点研究了经典的MST分割算法(Mask-Based Subtraction Technique)和LLT分割算法(Logical LevelTechnique),分析并讨论了算法涉及的参数,指出了算法中存在的问题。针对MST算法运算速度慢以及内存消耗大等缺陷,本文重点分析了该算法中字符笔画宽度W和阈值T的计算方法,提出了利用六个特殊边缘点和统计法的方法来获取字符笔划宽度W以及利用图像中所有邻近像素点线形均值与此像素点差值的均值来获取阈值T的方法来改进MST分割算法。实验结果表明,改进的MST分割算法具有分割效果好和稳定性等优点。LLT算法具有噪声敏感度低,运算速度快等优势。为解决复杂背景下女书字符图像分割处理中存在的问题,本文提出了改进的LLT分割算法。首先对图像边缘像素点进行扩展,以减小分割时产生的误差,然后结合图像中各区域的灰度分布情况,给出了一种基于区域特点的自适应局部阈值计算方法。实验结果表明,与原LLT算法和经典的OTSU算法相比,本文提出的改进LLT算法不仅去噪能力强、分割准确度高,还具有较强的适应性。
其他文献
文字是记录中华五千年文明的重要方式,研究古籍汉字对研究中华文明有着重要的意义。古籍汉字数量大、笔画多变、结构复杂、相似字多、区分困难,对古籍汉字进行适当的电子化并进
随着知识经济的快速发展,企业对知识的需求越来越强烈,很多企业通过引入知识管理系统来管理企业内部的知识资源。然而,系统中知识资源的急剧增长导致用户很难找到真正需要的知识
自然灾害、城市各种突发事件的发生,给人类带来了巨大的损失和伤害,国家和政府部门吸取了大量的经验和教训,加强应急决策,针对各种自然灾害,为保证人民群众的生命和财产损失,维护社
运动目标跟踪是计算机视觉研究中比较关键的一部分,同时也是交通视频网络下底层关键技术,视频网络下的目标跟踪已经应用到社会生活、经济、军事等领域,所以交通视频网络下的目标
随着Web2.0的迅速发展,网络上各类信息越来越开放。很多服务提供商不仅仅在本身的站点页面上提供相应的内容和服务,同时还提供了程序接口,使第三方可以自由地获取和使用相关的服
移动经营分析系统(Business Analysis and Supporting System,简称BASS)是中国移动业务运营支撑系统的核心子系统之一。移动BASS具有海量数据存储、数据源繁杂、处理能力要求
传统的图像导航系统主要以患者的三维组织解剖结构模型为基础,而三维结构模型主要通过对患者术前图像的三维重建和可视化来获得。对于涉及软组织的导航过程,由于人体呼吸、身体
古籍汉字数量巨大、结构复杂多变,且存在大量的相似字,使用传统的图像检索方法对古籍汉字图像进行检索效果并不理想。本文通过对古籍汉字图像的结构特征进行分析和总结,设计了一
随着计算机技术的快速发展,软件已经应用到人们日常的学习、工作和生活的方方面面。随着软件应用规模的增大,人们对软件的依赖性越来越强,并且希望软件的功能更加强大,应用更加方
定位问题是实现移动机器人自主能力的基本问题。然而,目前大多数定位方法都是被动的,即不考虑定位结果对机器人控制的影响。由于机器人运动的盲目性,导致定位效率低下。近年来受