论文部分内容阅读
近年来,随着智能手机的大量投入市场,基于计算机视觉技术的相关产品得到了用户的广泛应用,其中就包括人脸检测、人手检测等智能检测算法的研究应用。作为目标检测领域中的重要组成部分,文字检测在近年来也越来越得到人们的重视。其中,在自然场景下的文字检测算法等相关研究工作逐渐成为了学术界研究的热点之一。不同于对扫描文档等内容的文字,由于环境和拍摄镜头的影响,自然场景下的文字常存在于复杂的背景环境、不同的光照条件下,而且呈现出不同的字体和颜色。因此,研究在自然场景下的文字检测算法,提高检测准确率,增强算法的鲁棒性,从而降低误检率,具有重要的意义。考虑到自然场景的复杂性,必须使用更加鲁棒的特征来表示文字并与非文字相区分。由于文字的宽度具有很强的稳定性和一致性,所以本文重点分析了基于笔画宽度变换(SWT)的文字检测算法。但是由于SWT存在参数个数过多、计算拐角边缘方向失效等不足,为了克服这些缺点,本文提出了一种新的文字检测特征——随机宽度直方图,并且引入局部二值模式纹理特征(LBP特征)以及支持向量机学习算法(SVM),从而形成了一种更为有效的文字检测算法。本文在检测文字宽度特征算法的基础上,使用了两个公开的标准数据库(包括ICDAR数据库和街景数据库)作为测试集,对本文所提出的文字检测新算法与两种经典的基于宽度的文字检测算法进行了实验对比。从实验结果可以看出,本文提出的基于随机宽度直方图的自然场景文字检测新算法,在提高了文字检测的准确率的同时,降低了误检率,并且减少了所需调节参数的个数。