论文部分内容阅读
信息技术和现代工业的飞速发展,智能手机、平板电脑等移动设备的快速普及,使得通过拍照获取图像十分常见。利用计算机、互联网等信息处理技术来存放和处理图片与文字已成为主流。OCR技术是提取图片中文字信息最为高效的方法之一,有着广泛的应用。然而,在拍照过程中会由于各种主客观因素,如光照情况不佳、所拍摄纸张的质量不好等,可能会导致获取到的图像中出现噪声、阴影、局部强光等现象。这些干扰会导致图像质量降低,直接影响OCR识别效果。目前OCR技术的不足主要表现为对低质量图像的适应能力不足,无法提取出完整和正确的文字信息。为解决这一问题,本文首先介绍了图像处理领域的一些基本理论,然后阐述和分析了光照失真文本图像的特征、图像处理领域的常用技术手段和国内外现有的一些应用较为广泛的校正方法。在充分研究了光照失真文本图像区域亮度特征的基础上,针对该类图像提出了基于分块的校正方法。文章首先介绍了国内外有关本研究课题的研究现状和发展趋势,然后阐述了图像处理领域常用的图像特征提取、图像增强、二值化、去噪等关键技术的基本理论和流行算法。在分析了文本图像常见光照失真的表现形式的基础上,研究了光照失真对图像特征造成的影响。第四部分具体描述了本文校正方法的研究过程与设计实现:将图像分块并根据各块区域亮度特征区分出光照失真块和非失真块。对于光照非失真块采用区域OTSU算法进行二值化以节省处理时间,对于光照失真块则先进行图像增强,然后对增强后的图像块再次根据其区域亮度,判断采用区域OTSU算法或者本文改进的White算法进行二值化。校正方法的最后一步是对输出的二值图像进行去噪,以获取更好的OCR识别效果。实验结果表明,本文提出的解决方案对光照失真文本图像能够取得令人满意的校正效果,在OCR识别率和校正耗时方面比现有的校正方法均有优势,而且具有较强的鲁棒性。