论文部分内容阅读
随着互联网发展和图像录入设备的普及,图像在人们的生活中越来越受到关注。图像除了更加生动展示了事物,而且比单纯文字蕴含着更多的信息,从图像中获取文字信息优点就是,可以获取与图像相关联的文字信息,通过对文字信息进一步处理,如互联网检索,能够从这些文字信息当中获取更多的图像信息。但是如何从图像中获取文字信息,一直是令人困扰的话题。为了能够从各种复杂的图像中提取文字信息,各种文字识别理论相继提出,并从在实践中取得一定成果,近年来,场景文字识别技术得到计算机视觉社区研究人员青睐,并一直处于研究发展当中。本文基于已有的场景文字识别算法,对场景文字识别技术的理论与实践进行了系统深入的研究。在文字识别方法中,本文分析了传统文字识别技术和非传统文字识别理论方法,并介绍了2种流行文字识别算法,即基于MSER算法和基于SWT算法,提出了一种基于SWT改进算法;在文字提取方法中,本文分析了传统文字提取技术和非传统文字提取理论方法,并介绍了2种流行文字提取算法,即基于Otsu算法和基于分水岭算法,提出了一种基于Otsu改进算法;在深度学习文字识别方法中,本文分析了深度学习一般框架和流程,并介绍了时下流行CTPN场景文字识别算法,设计了一个基于CTPN+CRNN文字识别系统。本文通过实验仿真,在文字识别方法中,改进了基于SWT算法流程,使其加快识别速度,实验结果表明,改进的算法符合实际要求,速度提升了38%左右;在文字提取方法中,改进了基于Otsu算法流程,使其具有更好的识别效果,实验结果表明,改进的Otsu算法不仅逼原算法效率高,而且要比传统的全局Otsu算法分割效果要好;在深度学习文字识别方法中,本文设计了一个基于CTPN+CRNN的场景文字识别系统,其系统的查准率和查全率表现良好,对实际场景文字识别实践方法具有一定的借鉴意义。