论文部分内容阅读
随着当今信息技术的高速发展,由于办公数字化需求不断增长,文档图像处理正逐渐替代纸质文档的手工处理,扫描文档图像是纸质文档通过扫描仪、数码相机或文档处理系统输入到计算机系统的,它具有储存空间小,管理方便,处理快捷等特点。数字文档图像越来越多地应用到网上阅卷、数字化图书馆、银行、档案管理等工作中。因此,对文档图像的处理是一个非常具有现实意义和实用价值的研究。扫描文档图像处理主要涉及两个方面:一是为了改善扫锚文档图像的质量,提高后期处理的精度,需要优化原始的文档图像处理,例如去噪、纠偏等,二是为了满足特殊需求对文档图像进行加密、加水印等处理。本文主要研究第一个方面的内容,针对现有文档图像处理所涉及的图像倾斜检测、实时纠偏等方面做详细的介绍和研究,并提出相关的处理算法。由于人为因素、扫描仪等走纸机构的机械误差的影响,文档图像通常会存在一定的倾斜角度。文档图像预处理是文档版面分析、理解、OCR识别、文档图像恢复等后续处理过程的基础工作,具有重要研究意义,倾斜角度估计的准确性也就显得格外重要,同时在大规模文档图像处理过程往往需要实时实现图像的纠偏功能,因此研究高速图像插值方法和文本行定位算法十分必要。本文在文档图像倾斜角度估计方面提出了一种基于扫描边界特征的复杂文档图像倾斜角估计算法。该算法首先通过边界特征点检测方法标记能够代表倾斜角度的直线特征点,计算这些特征点之间的倾斜角,并基于投票方法估计倾斜角度的分布,利用高斯小波变换的突变信号检测方法估计该直线段的倾斜角,实验证明该方法对噪声不敏感,具有非常高的检测精度和稳定性。在文档图像纠偏方面本文提出了一种基于文档图像中含有空白区域特征的高速插值方法。该算法通过分析文档图像的分块统计特征,使用空白图像块的拷贝结合双线性插值方法得到纠偏图像。本文给出了算法的实现过程,理论和实验结果表明该算法可充分确保扫描图像的纠偏质量,运行效率高于双线性插值算法,在文档图像扫描过程取得了良好的应用效果。在文本行分割算法方面本文提出了一种基于高斯函数一阶导数阶跃特性分析的文本行检测算法。该算法通过分条带投影函数估计文档图像字符密度图像,然后使用突变信号分析方法获取文本行的边界点,这些边界点构成了文本行的特征点,这些特征点具有连续、单像素的特点。由于投影函数的统计特性和高斯函数的突变信号检测能力,该检测算法对含有一定噪声、交叠、直线噪声的文本畸变不敏感。实验结果表明该算法具有非常高的检测精度和稳定性。