扫描文档图像的处理方法的研究和应用

来源 :山东师范大学 | 被引量 : 0次 | 上传用户:tdsl
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着当今信息技术的高速发展,由于办公数字化需求不断增长,文档图像处理正逐渐替代纸质文档的手工处理,扫描文档图像是纸质文档通过扫描仪、数码相机或文档处理系统输入到计算机系统的,它具有储存空间小,管理方便,处理快捷等特点。数字文档图像越来越多地应用到网上阅卷、数字化图书馆、银行、档案管理等工作中。因此,对文档图像的处理是一个非常具有现实意义和实用价值的研究。扫描文档图像处理主要涉及两个方面:一是为了改善扫锚文档图像的质量,提高后期处理的精度,需要优化原始的文档图像处理,例如去噪、纠偏等,二是为了满足特殊需求对文档图像进行加密、加水印等处理。本文主要研究第一个方面的内容,针对现有文档图像处理所涉及的图像倾斜检测、实时纠偏等方面做详细的介绍和研究,并提出相关的处理算法。由于人为因素、扫描仪等走纸机构的机械误差的影响,文档图像通常会存在一定的倾斜角度。文档图像预处理是文档版面分析、理解、OCR识别、文档图像恢复等后续处理过程的基础工作,具有重要研究意义,倾斜角度估计的准确性也就显得格外重要,同时在大规模文档图像处理过程往往需要实时实现图像的纠偏功能,因此研究高速图像插值方法和文本行定位算法十分必要。本文在文档图像倾斜角度估计方面提出了一种基于扫描边界特征的复杂文档图像倾斜角估计算法。该算法首先通过边界特征点检测方法标记能够代表倾斜角度的直线特征点,计算这些特征点之间的倾斜角,并基于投票方法估计倾斜角度的分布,利用高斯小波变换的突变信号检测方法估计该直线段的倾斜角,实验证明该方法对噪声不敏感,具有非常高的检测精度和稳定性。在文档图像纠偏方面本文提出了一种基于文档图像中含有空白区域特征的高速插值方法。该算法通过分析文档图像的分块统计特征,使用空白图像块的拷贝结合双线性插值方法得到纠偏图像。本文给出了算法的实现过程,理论和实验结果表明该算法可充分确保扫描图像的纠偏质量,运行效率高于双线性插值算法,在文档图像扫描过程取得了良好的应用效果。在文本行分割算法方面本文提出了一种基于高斯函数一阶导数阶跃特性分析的文本行检测算法。该算法通过分条带投影函数估计文档图像字符密度图像,然后使用突变信号分析方法获取文本行的边界点,这些边界点构成了文本行的特征点,这些特征点具有连续、单像素的特点。由于投影函数的统计特性和高斯函数的突变信号检测能力,该检测算法对含有一定噪声、交叠、直线噪声的文本畸变不敏感。实验结果表明该算法具有非常高的检测精度和稳定性。
其他文献
<正>在我国最早的一部工艺著作《周礼&#183;考工记》中,开篇即是&#39;天有时,地有气,材有美,工有巧&#39;之语。其后又说:&#39;审曲面执,以饬五材,以辨民器,谓之百工&#39;。《
期刊
关于眼睛的溢美之词不胜枚举,但伴随着科学浪潮的涌动,人类的双眼对传统二维的图像信息已很难满足,画面上更生动、视觉上更符合人眼特性的立体图像开始备受青睐。产生立体图像的
鸡传染性法氏囊病又称传染性腔上囊炎,是由传染性法氏囊病病毒引起的主要危害雏鸡一种急性高度接触性传染病。发病率高、病程短。法氏囊、肾脏病理变化、腿肌和胸肌出血、腺胃
RBRVS在美国得到了广泛的研究与应用,实践表明能较好地反映医师的工作量、技术难度和风险程度等,可以作为一种有效评定医师绩效薪酬的工具。RBRVS在我国有着较好的应用前景,
本文介绍了一种基于PLC的配煤自动控制系统,该系统融计算机技术、信息技术、变频技术和PLC技术于一体,对提高和稳定配煤产品的质量,提高生产效率和企业经济效益有着积极作用
在阅读过程中,读者不会注视每一个词,而会跳过一些词,这一现象被称为“词跳读”。已有研究发现,在中文阅读中约40-60%的词会被跳读。在阅读中为什么会存在跳读?被跳读的词是
利用UV Vis吸收光谱仪和光化学反应器 ,研究了菁染料和份菁染料的光降解动力学 .研究结果表明 ,染料在乙腈溶液中的光褪色反应遵循假一级或零级动力学衰减 .与相应的份菁染料
当你和银行做按揭贷款时,如果银行不再强制你从财险公司购买房贷综合保险,但你自己又担心今后的还款缺乏必要的保障,那么为了寻求一份安心,为了让家人“安居”,或许到时候你可以向
当前,提供包含内嵌式RFID标识的包装容器和包装材料已经成为一种趋势,近日,位于美国俄亥俄州的领先的包装供应商O-I包装集团也凭借一款包含嵌入式RFID标识的药瓶成功进入了这一