自然场景图像文本检测研究

来源 :天津大学 | 被引量 : 0次 | 上传用户：w_wallace

【摘要】

：

随着手机、平板等智能移动终端的普及，使用移动设备的摄像头所拍摄的自然场景图像大量涌现。文字作为人类最具影响力的发明之一，在人类生产和生活当中一直扮演着十分重要的角色

【作者】

：

杜一帆

【机构】

：

天津大学

【出处】

：

天津大学

【发表日期】

：

2016年期

【关键词】

：

场景图像文本检测图像处理 MSER算法

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着手机、平板等智能移动终端的普及，使用移动设备的摄像头所拍摄的自然场景图像大量涌现。文字作为人类最具影响力的发明之一，在人类生产和生活当中一直扮演着十分重要的角色，是自然场景图像的重要组成成分之一。它包含着丰富的语义信息，是人类思想和情感表达的重要载体，在自然场景中随处可见。与其他对象相比，人们往往更加关注图像中的文字部分。检测图像中文字所在的位置，将其提取并识别出来对场景图像的分析有着重要的意义。　　本研究阐述了目前场景文本检测领域中存在的困难和挑战，以及常用的文本检测特征及方法，并对它们的优缺点进行了分析，提出了一种基于单样例的文本检测算法，通过计算目标图像与单样例图像之间的特征相似度，对自然场景图像中文本区域进行初步定位，显著减少了MSER算法所提取的文本候选区域中的非文本区域。对于文本候选区域，使用几何约束和笔画宽度特征，进一步移除其中的非文本区域。最后合并特征相似的文字区块，提取出图像中的文本区域。由于基于学习的算法需要大量的训练样本、训练速度较慢，另外在拥有复杂背景的自然场景图像中采用 MSER算法易检测到大量的非文本区域，本文所提出的算法针对以上问题进行了改进。实验结果表明，与其他算法相比，该算法能够准确检测出图像中的文本区域，达到理想的定位效果。提出了一种基于学习和多通道MSER的文本检测算法，有效的解决了传统 MSER算法对模糊、低对比度以及不均匀的光照敏感等问题。首先对彩色边缘图和对比度增强图像提取 MSER区域作为字符候选区域，然后结合卷积神经网络提取字符的高级特征，使用SVM对这些特征进行训练得到一个理想的文本与非文本分类器，从而增强了文本检测算法的性能。

其他文献

海底动力环境监测系统的设计与实现

占地球面积50%的深海海底以其广阔的空间、丰富的资源和特殊的政治地位日益成为世界各国关注的战略区域。海洋动力环境数据包括温度、盐度、密度、溶解氧、波浪、海流(含潮流

学位

海底动力环境嵌入式系统ARM多线程

新型分布式光纤放大技术及其传感应用研究

本论文属通信(光纤通信)与信息系统(传感信息获取)学科。　　相对于分立式的光纤放大技术,分布式拉曼放大(DRA)技术在噪声指数、非线性损伤、增益带宽等诸多方面展现出明显优

学位

光纤传输分布式拉曼放大传感特性布里渊光时域分析激光器

DCI数字电影关键技术研究

随着计算机技术的飞速发展,传统电影制作中引入了数字技术,一方面弥补了传统镜头做不到的特技效果,另一方面大大方便了影片的传输。于是,为了统一数字电影在整个数字电影系统

学位

DCI立体加密MXF

目标数目未知下的压缩感知定位算法

无线传感器网络(WSN)的快速发展,使得基于WSN的定位服务具有巨大的市场价值。高效、实时、精确的定位算法是决定该定位服务潜力的关键性因素。在传统的WSN定位算法中,基于接

学位

压缩感知无线传感器网络目标定位贪婪匹配追踪算法

高维可视信号的结构化处理

可视信号（包括图像、视频、光场等）因其高维特性以及受光照、背景噪声、尺度变化和非刚性形变等因素的影响，相比传统低维信号（如雷达信号、声音信号等）呈现更复杂的变化和更抽象的

学位

视频分割可视信号结构化处理概率聚类物体识别

基于机器学习的宿舍通道管理系统设计

目前我国高校仍处于持续扩建与开放阶段,高校的校园安全问题日益凸显,各高校也在积极地铺设校园安防系统保证校园内师生各方面的安全。宿舍安全作为校园安全问题中重要的一环

学位

机器学习面部识别出入规律学习通道管理系统

自然场景图像文本检测研究

其他学术论文