自然场景图像文本检测研究

来源 :天津大学 | 被引量 : 0次 | 上传用户:w_wallace
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着手机、平板等智能移动终端的普及,使用移动设备的摄像头所拍摄的自然场景图像大量涌现。文字作为人类最具影响力的发明之一,在人类生产和生活当中一直扮演着十分重要的角色,是自然场景图像的重要组成成分之一。它包含着丰富的语义信息,是人类思想和情感表达的重要载体,在自然场景中随处可见。与其他对象相比,人们往往更加关注图像中的文字部分。检测图像中文字所在的位置,将其提取并识别出来对场景图像的分析有着重要的意义。  本研究阐述了目前场景文本检测领域中存在的困难和挑战,以及常用的文本检测特征及方法,并对它们的优缺点进行了分析,提出了一种基于单样例的文本检测算法,通过计算目标图像与单样例图像之间的特征相似度,对自然场景图像中文本区域进行初步定位,显著减少了MSER算法所提取的文本候选区域中的非文本区域。对于文本候选区域,使用几何约束和笔画宽度特征,进一步移除其中的非文本区域。最后合并特征相似的文字区块,提取出图像中的文本区域。由于基于学习的算法需要大量的训练样本、训练速度较慢,另外在拥有复杂背景的自然场景图像中采用 MSER算法易检测到大量的非文本区域,本文所提出的算法针对以上问题进行了改进。实验结果表明,与其他算法相比,该算法能够准确检测出图像中的文本区域,达到理想的定位效果。提出了一种基于学习和多通道MSER的文本检测算法,有效的解决了传统 MSER算法对模糊、低对比度以及不均匀的光照敏感等问题。首先对彩色边缘图和对比度增强图像提取 MSER区域作为字符候选区域,然后结合卷积神经网络提取字符的高级特征,使用SVM对这些特征进行训练得到一个理想的文本与非文本分类器,从而增强了文本检测算法的性能。
其他文献
占地球面积50%的深海海底以其广阔的空间、丰富的资源和特殊的政治地位日益成为世界各国关注的战略区域。海洋动力环境数据包括温度、盐度、密度、溶解氧、波浪、海流(含潮流
本论文属通信(光纤通信)与信息系统(传感信息获取)学科。  相对于分立式的光纤放大技术,分布式拉曼放大(DRA)技术在噪声指数、非线性损伤、增益带宽等诸多方面展现出明显优
随着计算机技术的飞速发展,传统电影制作中引入了数字技术,一方面弥补了传统镜头做不到的特技效果,另一方面大大方便了影片的传输。于是,为了统一数字电影在整个数字电影系统
无线传感器网络(WSN)的快速发展,使得基于WSN的定位服务具有巨大的市场价值。高效、实时、精确的定位算法是决定该定位服务潜力的关键性因素。在传统的WSN定位算法中,基于接
可视信号(包括图像、视频、光场等)因其高维特性以及受光照、背景噪声、尺度变化和非刚性形变等因素的影响,相比传统低维信号(如雷达信号、声音信号等)呈现更复杂的变化和更抽象的
目前我国高校仍处于持续扩建与开放阶段,高校的校园安全问题日益凸显,各高校也在积极地铺设校园安防系统保证校园内师生各方面的安全。宿舍安全作为校园安全问题中重要的一环