论文部分内容阅读
文字是人和人之间进行思想、感情交流的重要工具,也是人类社会获取知识、传播知识的一种重要载体。目前,随着各种摄像设备的快速发展,人们可以很方便地获得大量的文字图像,如何从这些文本图像中提取出其中的文字信息,具有重要的理论意义和非常广泛的应用。本文针对相机拍照得到的文本图像,研究了文本图像二值化、文本区域的检测、单字符的分割等问题。本文的主要工作如下: 1.提出了一种基于小波变换的快速二值化算法,其基本思想是:先对原始图像进行小波分解,然后,对于得到的低频图像利用传统的全局阈值法计算阈值,并利用得到的阈值对原图进行二值化处理。实现了基于Harr小波变换和Otsu算法、Harr小波变换和简单统计法以及Harr小波变换和简单迭代法的快速二值化算法,并和传统的全局阈值法进行了比较。实验结果表明,本文提出的二值化算法的效果和传统全局阈值法差别不大,但计算速度有明显提高。 2.提出了一种基于多孔小波变换的文本检测和二值化算法,首先,对图像进行多孔小波变换,并根据高频分量的大小对图像进行初步的二值化,然后,利用水平和垂直方向投影的方法检测文本区域,最后,对于原图在检测得到的文本区域中利用局部 Otsu算法对二值化的效果进行改进(文本区域外均设为背景色)。实验结果表明,采用这种方法对文本图像进行二值化,不论是视觉上还是文字的正确识别率上均比传统的各种二值化方法要好。 3.提出了基于多线程处理的局部阈值二值化算法。实现结果表明,在具有多核处理器的计算机上,这种方法可以明显地提高二值化的速度。 4.在VC2008环境下,利用OpenCV编程实现了本文提出的各种文本图像二值化算法、文本检测算法以及基于形态学的二值图像去噪算法,并实现了单字符的分割。