自然场景文字检测方法研究

被引量 : 0次 | 上传用户:beidoubiao
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图像中包含大量的文字信息,对基于内容的图像应用而言,准确高效地从图像中提取文字信息是一项非常有意义的工作。但是由于图像中的文字自身的多变性和文字背景的复杂性,自然场景中的文字检测仍然是一项极具挑战的任务。本文提出了两个文字检测方法:基于笔划宽度变换和深度信念网络的文字检测方法和基于最大稳定极值区域和卷积神经网络的文字检测方法。对于前者,本文首先使用笔划宽度变换算法对场景图像做笔划宽度变换,生成笔划宽度图。然后结合边缘梯度信息,将笔划宽度图中笔划宽度相似的像素连通起来,组成候选字符。接着使用启发式的过滤规则以及借助深度信念网络预训练的神经网络分类器,从候选字符中筛选出种子字符。然后使用种子字符生长在笔划宽度、高度、颜色等属性上近似的非种子字符,进而得到字符集合。最后将字符聚合成文本行,得到最终的文字检测结果。对于后者,本文使用最大稳定极值区域算法提取候选字符。然后借助一个级联的卷积神经网络分类器,从候选字符中提取种子字符。接着,使用一个迭代的渐进的生长算法从种子字符生长周围的非种子字符。本文设计了一个同时考虑组件几何特征和外观特征的相似度测量方法,用来评价一个非种子字符是否可以被一个种子字符生长。本文在多个公开数据集上测试了提出的两个方法。实验表明,基于笔划宽度和深度信念网络的文字检测方法,在多个数据集上表现良好。但受限于笔划宽度变换算法无法在复杂背景图像中生成高质量的笔划宽度图,因此该方法并不能取得最好的效果。而基于最大稳定极值区域和卷积神经网络的文字检测方法,在多个数据集上取得了最好的效果,尤其表现在更高的召回率上。这表示使用卷积神经网络作为种子字符分类模型的文字生长机制是非常有效的。
其他文献
村民自治是在中国农村发展社会主义民主政治的一个基本形式.黑龙江省村民自治有着自身发展的阶段性和特点,也面临一些突出问题.应针对存在问题的原因,采取有效的对策不断发展
汉语补语是现代汉语中一个重要的语法成分,由于它形式的多样性和句法功能的复杂性,留学生在使用补语时,难免会出现一些语法偏误。因此,在对外汉语教学中,补语一直是语法教学
通过案外第三人撤销之诉构建救济渠道,既可有效防止虚假诉讼,又能从程序权方面全方位保障案外人的权益,但用通常诉讼程序推翻确定判决在理论上还存在难以逾越的障碍。而对当
随着我国人口老龄化加剧,传统养老模式渐渐已经不能满足城市老年人的养老需要,城市社区居家养老模式开始逐渐发展起来。文章首先介绍了城市居家养老模式涵义,然后阐述了我国
体育无形资产、体育知识产权和体育无形财产权是3个联系紧密而含义略有差别的概念,在对无形资产、知识产权和无形财产权做出基本界定的基础上,专门分析体育无形资产和体育知
法官责任制是司法责任制的重要内容,是深化人民法院司法体制和工作机制改革的着力点和关键环节。建立和完善法官责任制,是防范冤假错案、实现司法公正的重要举措。实行主审法
目的评价准分子激光上皮下角膜磨镶术(LASEK)治疗中、高度近视的临床效果。方法应用美国VISX starS4准分子激光仪行LASEK治疗80例(176眼)中高度近视,屈光度-3.25~-12.0D,随访1
本文介绍了在减数分裂教学中的常用模拟方法,并对每种模拟教学方法作了评价。
论孙中山的人民观●陈邵桂孙中山一生致力于国民革命,他的思想理论体系———三民主义突出的是一个“民”字,正如他自己说的:“三大主义皆基本于民”①。本文拟对孙中山在领导中
马克思对供给需求问题的研究是其经济学理论中的重要组成部分,是分析市场经济规律的重要内容。既有研究文献主要涉及供给需求理论在马克思经济理论中的地位,马克思供给需求宏