基于字符特征的图像文字检测算法研究

来源 :西南大学 | 被引量 : 0次 | 上传用户:dffder
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图像中的文字定位与提取是当前热门且具有实际应用意义的课题。随着数码产品的普及,网络中出现大量来源于各种场景下的图像,检测和识别这些图像中的文字在工业界正越来越受重视。  由于图像的分辨率和对比度不确定,自然场景图像中的文字字体形状、大小和方向也不固定,且受到复杂背景和阴影的干扰,通过分析现有算法,发现大多算法是针对水平方向或者近似水平方向的文字检测,且在背景复杂、文字多变的情形下存在查全率和查准率低、鲁棒性差等问题。因此,基于由粗到精的检测思想,针对图像文字检测中的特定问题提出了相应的检测方法:  1、在检测文字过程中,现有算法普遍设定的阈值和参数过多,可检测的图像文字模式单一,对单张图像的处理时间过长。针对此问题,提出基于频域纹理特征的图像文字检测算法,首先对图像进行离散余弦变换,计算频域中块的纹理值并与阈值相比较得到候选的文字块,根据文字在图像中的几何属性确定最后的文字区域。  2、在选取字符的特征过程中,现有的算法选用的特征大多是字符的边缘、笔画宽度和颜色等特征,未能很好的把这些特征融合在一个算法中,导致在检测不同场景图片文字时鲁棒性差。针对此问题,提出基于字符笔画宽度和颜色聚类的图像文字检测算法,算法有效的融合了字符的三个典型特征,并对字符的笔画宽度给出了新的计算方法。通过提取图像中的梯度、宽度和颜色特征,使用K-means算法和ISODATA算法先后对图像像素点聚类,把获得的文字类像素点映射到同一幅图像中,根据文字的几何属性和形态学方法确定文字所在类,并剔除误检区域。  通过在ICDAR数据集和一些专家收集的图像数据集上进行实验,与现有方法相比,本文算法一在粗定位和精确定位阶段均能取得较好的效果,且计算复杂度较低。算法二在水平方向的文字定位能达到现有算法的效果,同时在复杂场景中任意方向文字检测效果有明显提高。
其他文献
组合优化问题是一类比较常见的问题,其理论与方法已经广泛应用于运筹学、控制论、管理科学和计算机科学等领域,并在工程技术、经济、军事等诸多方面都有着极为重要的应用。如:
学位
学位
近年来,随着GPS系统的不断发展,以及基于位置服务的普及,大量的时空数据在日常生活中日益积累,并为不同类型的应用所服务。由移动对象产生的时空数据被称作移动对象轨迹。如何从
在无线网络的路由中,如果处于不同路径上的两个节点间的距离太小,则在这两条路径上传输的数据相互之间很有可能会发生干扰从而导致数据的出错甚至丢失。这种场合就需要设计非干
云计算、物联网、移动互联、社交媒体等新兴信息技术和应用模式的快速发展,促使全球数据量急剧增加,推动人类社会迈入大数据时代。大数据应用背景下,用户对存储空间的需求越来越
认知无线电网络作为一种革新的通信范例,通过动态频谱共享,有效提升了紧缺频谱资源的利用率。认知无线电网络中的认知用户通过与周边环境进行交互,自适应调节传输参数,以共享授权
随着大数据时代的到来,全球数据总量爆炸式增长,云存储系统的规模越来越大,系统中硬盘故障的发生频率也因此变得越来越高。传统的被动容错模式只能通过不断增加冗余保证系统可靠
学位
随着移动互联网快速发展,移动终端面临的安全威胁也日益突出。Android系统凭借其开源、易定制的特性,已占据移动智能操作系统绝大部分的市场份额。自2008年的1.0版本以来,Androi