基于贝叶斯模型的自然场景文本检测算法研究

来源 :武汉大学 | 被引量 : 5次 | 上传用户:yanzixu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
自然场景中,文本信息为理解场景内容的重要信息。文本检测为进行图像内容分析的必要步骤,同时也是文本检测和识别系统的基础。由于自然场景不仅背景复杂且文本形式多样,检测自然场景图像中的文本信息仍然面临巨大挑战。因此,研究一种鲁棒性较强的文本检测算法具有重要的现实意义和应用价值。近年来,由于最大稳定极值区域(MSER)提取算子具有良好的仿射不变性,其在目标检测领域得到了广泛应用。传统MSER方法提取极值区域时,由于灰度图像的像素点灰度相似,导致极值区域提取存在过度融合现象。因此,为提高文本检测的准确率,本文采用了一种改进的MSER方法来得到文本候选区域,再利用朴素贝叶斯模型对文本候选区域做进一步筛选。本文主要工作如下:1)比较深入地研究了 MSER特征检测子的原理和极值区域提取过程,并对传统MSER方法提出了改进。由于传统MSER方法的检测结果区域中存在一些字符丢失或粘连的现象,本文采用一种基于边缘保持的MSER改进方法,实验表明,在数量和质量上,该方法得到的候选区域都要更好;同时,为更好利用图像的彩色信息,并提供更加丰富的文本候选区域,本文提出了一种在HSI色彩空间的H、S和I三个通道上基于边缘保持的MSER改进方法。实验表明该方法能够得到更加丰富的文本候选区域。2)为实现对候选区域的进一步筛选,本文研究了文本与非文本间存在的一些明显特征及朴素贝叶斯模型。本文提取了笔画宽度特征(SW)、色彩感知差异特征(CPD)和边缘梯度特征(eHOG)三个特征。在ICDAR2013数据集的训练集上针对文本和非文本,利用朴素贝叶斯对其进行学习得到文本和非文本的特征分布;在ICDAR2013数据集的测试集上,根据贝叶斯公式得到特征的后验概率。3)研究了图割算法,由得到的特征后验概率,以及结合字符的笔画宽度和色彩差异两个特征,构建了最小化能量模型,利用最大流最小割理论,对候选文本区域进行一个二值化标记及区域合并,确认文本区域;实验表明该方法对字符区域分类的准确性远远优于仅利用启发式规则。最后,对最终得到的文本标记区域,利用基于均值漂移(meanshift)的聚合框架构建文本行,完成文本检测。本文中,在ICDAR2013文本检测比赛数据集的测试集上对本文算法进行验证,并将得到的实验结果提交到ICDAR2013提供的公开验证平台上进行验证,验证表明针对绝大多数自然场景图像,本文算法能有效地实现文本区域提取。
其他文献
全员PR管理是维护社会组织形象、提高社会组织声誉的重要管理手段。新世纪职业学校面临新的境遇,如何谋求更大的生存与发展空间,振兴职业教育,全员PR管理应成为构建新世纪职
近年来,全球人力资源服务向平台化方向发展,服务形态更加丰富,新模式和新业态不断涌现,对我国发展人力资源服务业具有重要的启示和借鉴意义。$$一是人力资源服务向平台化方向发展
学位
满族传统民居历史悠久、风格独特,是东北地区乡村民居的代表形式之一。然而,进入2000年以来,在乡村生活生产、居住方式的快速变化的推动下,这种民居形制发生了深层次的变革,具体体现在建筑的生成逻辑、结构形式、材料形式、功能空间、文化发展等诸多方面。这种变革在一定程度上满足了当下居民的生活,但是由于发展时间过快,又缺乏完善的理论研究与技术支持,民居新类型也表现出一些负面现象,例如脱离地域文化、生态优势减
重金属离子废水及含酚废水是造成水污染的主要来源,对人类社会已经造成了很大的危害。因此,通过分子设计,制备既能够高效地处理废水中的污染物,又能够有效地分离和回收有用物
本文对河南电视台《梨园春》这一戏曲音乐节目做了较为全面的观察和剖析,其中包括《梨园春》产生的背景、发展历程、艺术业绩和节目的管理与改版等,并进一步分析节目成功的原
研究了常温(20℃)和冷藏(0℃)条件下不同浓度1-MCP处理对黄金梨采后贮藏品质及保鲜效果的影响。研究结果表明,1-MCP(1-Methylcyclopropene)处理能显著地降低黄金梨果实呼吸强
<正> 民间文学是在世界上每个国家,每个民族古老而又珍贵的文化遗产。她是每个国家,每个民族最早的文学作品,论其重要地位,远远超过当代的文学名著。她既是研究每个国家,每个
本文以山药为原料,经去皮、护色、杀菌等处理后,进行速冻,制定技术标准并研究提出质量控制的工艺参数.
期刊
采用阴极渗氢、洛氏硬度计、电子拉伸试验机、测氢仪、能谱(EDS)等手段研究了7003铝合金双级双峰时效下的力学性能及氢脆敏感性。结果表明,充氢前后7003铝合金的强度等性能具有