二值线条图及场景图像中的文本检测研究

来源 :南京大学 | 被引量 : 0次 | 上传用户：yadnlf

【摘要】

：

图像中的文字包含着丰富的语义信息，对于理解图像的内容具有重要意义。有了文字信息的帮助，可以方便地进行图片的分类、索引与检索，并进而设计各类应用。因此，图像文字区域检测已

【作者】

：

张振宇

【机构】

：

南京大学

【出处】

：

南京大学

【发表日期】

：

2011年期

【关键词】

：

场景图像二值线条图工程图纸文本检测

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

图像中的文字包含着丰富的语义信息，对于理解图像的内容具有重要意义。有了文字信息的帮助，可以方便地进行图片的分类、索引与检索，并进而设计各类应用。因此，图像文字区域检测已成为近期视觉内容理解的一个重要途径和研究热点之一，具有重要的理论研究价值和实际应用前景。　　现有图像文字区域的检测算法往往局限于特定的图像类型，并对字符区域的上下文信息有着较多的先验假设（如颜色一致、语言相关、无干扰元素或噪音等）。但由于在不同类型图像中，文字区域表现的形式不尽相同;且考虑到实际图像中大多可能存在复杂的背景、退化、干扰噪音，加之语言的多样性和字体的多样性，使得从多类广泛应用的图像类型中准确、鲁棒地检测字符区域依然十分困难。　　本文以两类典型图像——二值线条工程图及自然场景图中的字符区域检测进行了系统研究，首先着重探讨了退化线条图中的鲁棒、快速的字符检测问题，进而给出了适用于自然场景图像文本检测的扩展算法。论文提出了一种新的基于一致性单元的字符检测方法，该方法从文字笔划特征提取入手，充分利用构成文本的笔划间连通及形态特性来检测文本。由于有关联的笔划单元间具有方向固定、笔划宽度大致相同的特点，可视为构成字符的基本元素，因此本文方法首先定义并识别图像中存在的连续一致的笔划单元。在得到基本单元集合之后，本文算法针对字符的特点进行基本单元的筛选，排除不可能构成字符的元素;然后对于可能的基本笔划单元进行归并，形成候选字符。接下来对于所形成的候选字符，再次通过分析其中包含的基本单元分布特点及其它约束进行作进一步排除，由此得到可信的字符单元集合。最后根据字符的聚集性特征再次进行成串分析，以得到分割结果。　　实验结果表明，作为一种有效的字符检测算法，本文方法具有如下贡献:　　1.对二值线条工程图，无需先对非字符单元（如直线段、圆弧段、各类曲线）进行跟踪与分析，从而避免了相对复杂的非字符图元的追踪与识别过程。本文所提出的算法可应用于现存的海量工程扫描图像的快速内容检索或索引，并可进一步应用于各种扫描图文档管理系统;　　2.在二值线条工程图文本检测研究中，本文方法深入分析与探讨了有图元相交、粘连及噪音等各种复杂退化条件下的鲁棒文本检测算法，弥补了现有算法大多忽略处理各种退化情况的缺陷。此外，本文算法适用于不同的字体和语言文字，并可处理任意基线方向的文字;　　3.针对应用日益广泛的自然场景图像，文本进一步探索了上述算法对其中的文本区域的自动检测问题，并给出了算法验证与实验结果。

其他文献

案例推理在农村新能源利用辅助决策系统中的研究与应用

目前世界大部分国家都面临能源短缺，各国对能源尤其新能源发展给予很大重视，我国对新能源的研究与开发已取得了一定进展，但未达到预期的作用，其中最薄弱、最关键的问题是对农村新

学位

农村经济能源利用辅助决策系统案例推理理论

纯XMl-关系数据库系统性能基准测试的研究与实现

XML（Extensible Makeup Language，可扩展标记语言）以其结构化、内容与应用分离、自描述性、扩展性等优点广泛应用于数据交换、数据集成和（半）结构化数据管理等。随着XML技术的发展

学位

关系数据库系统性能基准测试方法可扩展标记语言

基于时间轴的标签个性化推荐

近年来，标签已经成为一种非常灵活和重要的手段来分享和分类网络资源，因为这些用户标签可以更加接近用户的理解和判断，所以这些用户标签可以更加准确地描述用户的兴趣偏好，而用户

学位

用户标签个性化推荐时间轴划片算法

基于多Agent的信息工程监理质量控制研究

多Agent技术引入信息工程质量监理领域，将使信息工程质量监理更好地适应网络环境的多样性和多态性，使信息工程监理进入智能化时代。本文旨在通过对多Agent在信息工程监理质量控

学位

信息工程质量监理分布式计算机技术系统优化

时延网络控制系统的鲁棒控制研究与仿真

随着计算机、通信、传感器和网络技术的发展与广泛应用，一种新型的分布式、智能化、网络化的控制系统应运而生—网络控制系统。它是利用专用或通用的通信网络连接构成闭环的控

学位

网络控制系统鲁棒控制器Lyapunov稳定性数值仿真

基于树状标签的文本组织系统的研究与实现

随着互联网技术的发展，Web上出现了大规模的用户和数据。对Web2.0时代海量信息进行有效的组织和分析，可以为用户提供更好的服务，具有非常重要的意义。树状标签系统就是对这些信

学位

文本信息内容标签树类别标签树语义依赖

IPv4/v6网络拓扑监测系统的设计与实现

网络拓扑管理作为IP网络管理的基本功能,主要实现网络拓扑自动发现、更新和配置信息管理。随着互联网的飞速发展,网络规模也在迅速扩大,基于IPv4协议的互联网逐渐显示出地址

学位

网络管理拓扑发现过渡分布式面向对象简单网络管理协议网际控制报文协议多播

基于视觉的自主机器人循迹系统的研究与设计

目前，机器人的应用领域已经扩展到了几乎所有的行业，并发挥着越来越大的效用，创造着巨大的价值以及有了越来越大的影响力。移动机器人是机器人学科的一个重要分支，而对移动机器人

学位

机器人自主循迹计算机视觉ARM处理器软件设计

噪声环境下基于乐纹的音乐检索方法研究

现实生活中，经常会遇到以下情况。当走在大街上突然听到一首引人注意的歌曲，它很可能就是非常喜欢的一首音乐，但是刹那间无法想起它的名称以及演唱者。这样就不可能利用音乐名称

学位

音乐检索方法乐纹提取噪声环境傅里叶变换

自组织无线网络中高容错虚拟骨干网的构建算法研究

无线传感器网络，因容易布置、造价低廉、功耗微小等优点，在军事和许多其它领域具有广泛的应用潜景，也因此成为学术界研究的热点。由于无线传感网络无集中的控制结点，广播通讯会消

学位

自组织无线网络高容错虚拟骨干网单位球图平板分解

二值线条图及场景图像中的文本检测研究

与本文相关的学术论文