复杂结构文档图像倾斜检测算法的研究与实现

来源 :北京大学 | 被引量 : 0次 | 上传用户:wocaodouji
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文档图像的倾斜检测是文档图像处理的重要环节,检测精度直接影响文档图像页面分析的效果及字符识别的正确率。同时,该项技术在智能化的文档图像浏览,智能复印机和智能扫描仪等领域中有着广泛的应用前景。 现有的文档图像倾斜检测算法主要在文字区域内提取倾斜特征,并且往往针对某种特定的语言文字设计算法。因而对于混合多种文字,版式结构,以及包含图表等非文本区域的复杂结构文档图像检测效果较差,缺乏鲁棒性。 本文在深入分析现有算法和复杂结构文档图像特点的基础上,提出了一种基于鲁棒边界段的文档图像倾斜角度检测算法(Robust BorderLine based skewdetection algorithm,简称RBL算法)。该算法首先从图像中的文本区域及非文本区域提取连通区域的边界段作为倾斜特征。然后通过对提取的边界段做PCA分析来度量边界段的线性程度,选择线性程度足够好的边界段进行迭代优化,得到鲁棒边界段及其对应的倾斜角度。最后通过计算所有鲁棒边界段倾斜角度的加权中值得到整幅图像的倾斜角度。通过大量对比实验表明,该算法具有速度快,精度高,适用范围广的特点。 论文的第一章论述倾斜检测在文档图像处理中的作用,并介绍本文的主要工作;第二章将对现有的算法进行全面的介绍和分析。RBL算法的详细步骤及实现方法在第三章给出。论文的第四章介绍如何RBL本文算法应用于印章图像的倾斜角度检测。实验结果及分析在第五章给出。最后对全文进行总结了并对未来的工作进行了展望。
其他文献
本研究应用一种将传统GKT、CQT测谎范式与事件相关电位怪球实验范式相结合扩展怪球测谎范式,并在现代信号处理方法独立分量分析(ICA)的基础上,引入眼动电位(electro-oculogram,E
密集波分复用技术的出现,使得建立大容量高效率的光纤网络成为了可能。而电交换和光传输速率的巨大差异,使得研究和开发全光交换技术成为业界迫在眉睫的头等大事。作为一种结合
波达方向估计是阵列信号处理中一个非常重要的研究领域,由于其在雷达、声呐、海洋测绘、医学成像、数字移动通信及机器故障诊断等许多领域中有着广泛且重要的应用背景而受到重
随着全球范围内互联网的迅速发展,人们对网络的要求越来越高,不断提出新的要求,各种具有较高突发性和多样性的业务不断涌现。光突发交换(OBS)技术结合了光电路交换和光分组交换
随着信息技术的快速进步,我国的数字电视产业也得到了迅猛的发展,数字电视已逐步取代了传统的模拟电视。随着数字电视的普及,数字电视前端设备的数量也在飞速地扩大,数字电视
当前,网格在汇集和共享地理上分布的海量空间资源,并对其进行一体化组织与协同处理方面发挥着越来越重要的作用。其中,在网格环境动态变化及空间资源分布不均的情况下,如何实现空
近年来,基于听觉机理的声源定位方法研究已经成为该领域的研究热点。许多工作都基于一种简化的人头模型,即利用球散射体和双传声器分别模拟人头和双耳作用的物理模型展开研究,然
尽管对推荐系统的研究已经超过了十年,却很少有相关研究为匿名用户推荐。数字图书馆环境中的大部分用户都是匿名用户,而且这种匿名访问方式在图书馆界仍会长期存在。如何为这类
随着互联网技术的飞速发展,在INTERNET上传输和交换的数据格式越来越多样化,HTML语言本身所具有的弱点,使得其已不能满足WEB越来越广泛的应用,以统一标准,灵活格式的数据标准XML技
运动目标监控系统作为智能视频监控系统的一种,一直是国内外研究热点之一。本文设计与实现了一种基于TMS320DM643处理器的运动目标监控系统,详细阐述了该系统的硬件构成、软件