论文部分内容阅读
OCR技术可将纸质文字信息高速地录入到计算机中,它的研究大大地促进了图像处理、模式识别等学科的发展。OCR技术的诞生有效地解决了信息输入与信息处理间效率不对等的矛盾,提高了计算机系统的整体效率,节省了不必要的劳动力。在信息化进程加速发展的今天,OCR技术已成为非键盘输入技术的首选,为各行各业提供了相应的便捷帮助。OCR技术在识别质量较高的文档图像时,可以保证良好的识别正确率,但在处理低质量的或存在多种字体的文档图像时,识别结果通常不理想,因此对于OCR技术识别这些特殊类文档图像的算法研究仍是亟待解决的课题。本文分析特殊类文档图像特点,发现对于低质量文档图像,需要对当前OCR系统的图像预处理即二值化环节进行改进,而对于多字体文档图像,则更应侧重对汉字识别算法的研究。因此本文研究了大量国内外的二值化算法及字符识别算法,并分别为低质量文档图像及多字体文档图像提出了相应算法,以提高OCR系统的整体识别正确率。主要的研究内容为:第一,为低质量文档图像提出了一种基于区域对比度增强的二值化算法。该算法首先根据像素点的灰度对比度信息通过四叉树原理自适应地进行区域划分,然后对不同属性的区域利用对比度增强法分别进行灰度调整,最后根据区域图像的灰度直方图选取局部阈值。该算法与另四种全局及局部算法进行对比,对DIBCO图像集的所有图片进行仿真,通过定量分析发现本文算法可获得最高的F-measure值及峰值信噪比(PSNR值)。同时将各算法的二值图像输入到ABBYY字符识别软件中,本文算法的二值图像获得最高的识别正确率,高达98.49%。第二,为多字体文档图像提出了一种Gabor变换与小波变换复合的汉字识别算法。该算法首先对待识别图像进行归一化处理,其次提取处理后图像的小波特征及Gabor征特征,最后利用支持向量机作为分类器进行识别分类。本文通过对一级字表中笔画结构不同的100个汉字进行识别,识别正确率可达到98.50%以上。