图像中文字检测技术研究与实现

来源 :国防科学技术大学 | 被引量 : 0次 | 上传用户:wo7ni1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在互联网上,搜索引擎Google、百度、Bing等改变了整个时代,便捷了所有人的生活,然而它们是基于文字搜索的,对于图片和视频等基于内容的搜索还不大成熟。随着成千上万的视频传上互联网,对浏览和检索视频数据的工具需求越来越迫切。图像文字信息提取系统能够将图像中的文字检测出来并识别,自动建立图像索引,随后传统的搜索引擎就能够对图像进行检索。完整的图像文字信息提取系统包括检测、定位、提取、增强和识别图像中的文字,一般也把这个过程归纳为主要的两步:文字检测和文字识别。本文研究的是文字检测,包括字幕文字的检测和场景文字的检测。在检测字幕文字时,本文改进实现了一种基于区域的方法,先用边缘检测算子得到图像的边缘信息,再计算其最大差分标准图,采用局部阈值法将其二值化,然后利用游程平滑算法将文字连接成文字串,最后经过区域分析定位文字区域。本文方法原理清晰,计算量小,鲁棒性高。检测场景文字时,本文基于MSER和SWT算法,提出了一种新型的算子GSWT用于检测文字。最稳定极值区域(MSER)在模糊、低对比度和低光照、彩色和纹理变化的情况下鲁棒性较好,而GSWT是检测文字笔划的可靠方法,二者结合使用可以提高文字检测的准确率。考虑到场景文字中可能含有噪声,此时原来的方法会受到大幅的影响,一方面噪声的增多,使得MSER区域增多,给GSWT带来了计算量的增大;另一方面噪声的出现,使得虚警的概率升高,文字提取的准确率会下降。因此,本文探讨了两种保持边缘平滑滤波器(EPSF)——导向滤波器和自适应流型滤波器。在处理和分析含噪声的图像文字时,EPSF能够过滤噪声,同时文字的边缘信息得到保留,此时基于MSER和SWT的方法依然可行。本文仿真实现了基于区域的字幕文字检测系统和基于MSER和GSWT的场景文字检测系统,对标准数据库进行的测试表明,本文所实现的方法达到了同类较先进的水平。
其他文献
我院近12年间病毒性肝炎住院病死率平均为5.79%,各型肝病中以重型肝炎病死率最高,肝硬化次之,通过本文统计分析,可以了解该类患者的死亡原因及可能的防治方法.
本文运用文献资料法等研究方法,对高校体育教师这一特定职业道德素养提升进行研究。研究认为,高校体育教师理应做到"德性与德行"相一致;坚持"做人与育人"相统一;加强"教学与
一看,看是否有开、合盖压力保护装置。开合盖压力保护装置通常设在把手与锅盖结合的地方。其作用有两个:一是当锅盖未完全扣合时,不让压力升高,因为此时锅盖扣合强度较低,如
伴随着经济全球化的发展,集群化经营已然成为现代化金融产业组织的一种基本形式,结合理论与实际来看,集群经营是我国商业银行海外经营的有效策略,对其动力的研究将有助于我国
近年来,在城市化高速发展和城市更新快速推进的过程中,我们发现历史街区的保护与更新总是矛盾很突出的地方。因此,如何解决好历史街区在城市化进程中的位置问题,使得历史街区
无证书公钥密码体制是介于传统公钥密码体制和身份公钥密码体制之间的一种密码体制,其优点在于不需要管理公钥证书,也不存在密钥托管问题。无证书公钥密码体制中,密钥生成中
城市滨江景观作为一项涉及民生的惠民工程,必须要通过以人为本的设计理念来得以体现。要体现城市滨江景观设计的时代性与城市地域的个性特点,必须让公众参与规划设计在后期人
<正> 例1,男,40岁,既往有支气管哮喘史,对粉尘、油烟过敏。此次发病又因三天前接角粉尘诱发哮喘发作,自服氨茶碱0.6/日,症状不缓解,于夜间10时来我院就诊。查体:血压16/10.7k
目的总结老年冠心病猝死的危险因素.方法对27例老年冠心病猝死的发生及病史、对策进行回顾性分析.结果老年冠心病住院猝死男性高于女性,尤其60~90岁为高发,猝死患者病史中多有
针对基地不同环境层面特点,探讨住宅小区环境设计过程中如何正确利用、保留和协调基地环境特点,建构一种可供分析操作的环境构思模式,从而形成一个系统而高效的总体设计理论