基于一般图形Voronoi图的版面分割方法

来源 :河北师范大学 | 被引量 : 0次 | 上传用户:woyaojiayou123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着社会的发展,电子文档的应用越来越广。因此,把记录在纸上的文字识别出来并转化为电子文档的OCR文字识别系统成为广泛关注的热点,相应的版面分割处理也成为重要的研究课题。 目前,随着复杂版面的出现,版面的编排已经不再局限为矩形。这使得传统的版面分割算法大部分已不再适用,同时处理复杂版面的各种版面分割方法应运而生。本文提出了一种基于一般图形Voronoi图的版面分割方法。该方法是一种基于连通域的分割算法。首先将文档图像进行二值化及滤波预处理,选择适当的结构元素对该二值化图像进行膨胀,然后把经过处理后的外部边缘作为一般图形Voronoi图的生成元,再根据离散生成法生成Voronoi图后与原图像进行并运算,从而完成最后的版面分割。该方法操作简单、有效,适用范围广,尤其对中文版的非Manhattan版面有很好的效果。
其他文献
本文针对三区复合型微分方程边值问题进行研究,基于微分方程边值问题解的相似结构理论,获得求解此类三区复合型微分方程边值问题的新方法。具体研究内容如下:  首先引进引解函
基于内容的图像检索(CBIR)技术是当前研究的热点问题。它主要是利用图像的视觉特征,如图像的颜色、纹理、形状等特征来进行检索。它突破了传统的基于文本检索技术的局限,直接对
本文首先介绍了第三代移动通信系统中的三大主流技术标准——CDMA2000、WCDMA和TD-SCDMA,并将这三种主流3G标准进行了对比,给出了它们的空中接口参数,简单概述了TD-SCDMA系统在
本文对分析学中几个基本问题进行了研究。 主要工作分为三部分: 在第一部分,除了对有关的基本概念和基础知识作了一般性介绍之外,引进了Hardy-Littlewood极大函数和Calder
这篇论文主要研究的是临床医学研究中缺失和截断数据两类不完全数据的统计推断问题。在临床医学研究过程中,由于各种原因,会不可避免地出现不完全数据的情况。本文主要以肿瘤
兖州矿业(集团)公司兴隆庄煤矿对10 kV及以下配电降低损耗的节能措施进行了研究,以获得更经济合理的效益。①调整完善电网结构。调整电网布局,缩短供电半径,高压尽量伸向用户
图谱理论主要研究图的矩阵(主要是图的邻接矩阵、拉普拉斯矩阵等)或图的算子的谱,通过建立图的拓扑结构(特别是图的各种不变量)和图的特征值及特征向量之间的联系,应用代数理
在中等职业学校,学生大多来自是成绩差没有考上高中的,而且学生来职业学校学习的目标是能够在这两三年学到技能走上社会.因此舞蹈社团在职业学校就有了一定的难度,而舞蹈作为
杂交油菜新品种宁杂27表现早熟、高产、优质、抗倒,成熟期熟相好、一致性好,较耐裂角,适合全程机械化生产,株高153.73 cm,一次分枝8.89个,单株有效角果382.99个,每角21.96粒,
在过去的几十年中,模式识别的研究发展很快。模式识别主要涉及由物质和精神的过程所得的度量的描述和分析。为了提供有力而有效的模式描述,通常需要用预处理消除噪声和多余信息