复杂文本图像倾斜校正算法研究

来源 :河南大学 | 被引量 : 0次 | 上传用户:yuanshidemeng36
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息科技的快速发展,加上现在人们的环保意识的增强,各个行业都推行无纸化办公。通过网络,工作人员可以将电子文档轻松的在各个部门间传阅,这极大地减少了人力和物资的开销,因此电子文档正逐渐地代替纸质文件。电子文档不断的改变着人们工作模式和生活方式,比如电子档案、银行票据、网上阅卷等等。因此将纸质的文档资料快速正确的转化为电子文档显得愈加重要和迫不及待。纸质文档在转换为电子文档时,难免由于人为或者设备的原因,文档图像通常会产生一定的程度的倾斜误差。而得到的倾斜电子图像不仅仅影响视觉效果,同时对图像版本分析有着较大的影响,因此研究图像的倾斜算法显得十分必要。本文主要研究复杂文本图像的倾斜校正,也就是文档中不仅包含文字,还有图像的文档。在现有的纯文本倾斜校正的基础上,提出了两种不同的复杂文本图像的倾角检测算法。第一种方法是首先通过对图像进行一系列的灰度化,二值化,图像分块等预处理;其次是根据Radon变换和数据分析方法的结合排除干扰倾角检测的子块;最后合并子块,并再次利用Radon变换检测倾角并校正。第二种方法是利用文本行的周期性得到较精确的倾角。首先同样是通过灰度化,二值化,图像分块等一系列的预处理;其次是利用Radon变换得到每个子块的倾角,对倾角数据进行快速傅里叶变换得到其在频域的分布图以及每个子块对应的功率与周期的关系图;最后是根据文本的周期性和功率大小进行子块的筛选,这样就可以得到文本较多的子块,然后利用Radon变换检测出倾斜角度,并进行校正。通过上述两种算法均可获取理想的倾角检测结果。根据实验结果对比与相关算法的分析显示,这两种算法均适用-180-180角度的检测和校正,相比之前的算法,在检测角度的范围上有了很大的提高,并且对于检测纯文本的图像,有着准确度高,鲁棒性强的优势。第一种方法具有很高的效率,但存在一定的误差。第二种方法的精确度比较高,且对于复杂结构和内容的数字图像都有较为精确的倾角检测,这样就大大提高了该算法的使用范围。
其他文献
互联网已经成为我们生活中不可缺少的工具,我们每天都会使用浏览器上网浏览网页,但是接入网络的计算机随时都处在被远程攻击的危险当中。当浏览器访问到恶意的Web服务器时,服
随着无线传感器网路技术的飞速发展,依靠无线传感器网络进行信息采集和动态监测的技术在小区安保、智能家具、危险区域信号采集、智能交通等领域得到了广泛的应用并创造巨大
虚拟现实系统是一项涉及仿真技术、计算机图形学、人机接口技术、传感技术、网络技术等多个学科的综合技术,它可以将数据和影像生成近似现实世界的三维视觉、触觉、听觉、运
移动远程医疗监护技术是远程医疗技术在移动网络和嵌入式技术上的应用,其目的是为患者提供实时、便捷的医疗服务。它是无线网络技术、嵌入式技术以及现代医疗技术等多种技术
对象存储是一种新兴的网络存储接口,它可以很好地解决附网存储(Network-attached Storage,NAS)和存储区域网(Storage Area Network,SAN)这两种网络存储结构的缺点,集合它们的
随着遥感技术的飞速发展,遥感影像分辨率的不断提高,遥感影像开始广泛应用于生产、生活中的各个领域。高分辨率遥感影像具有分辨率高、信息量大的特点,因此针对这类遥感影像进行目标特征的提取、分类可以获取大量有用信息。作为一种常用的非监督分类算法,ISODATA无需指定准确的类别数目,而是通过对聚类结果进行不断地“合并”与“分裂”,来得到一个较为合理的类别数目,从而得到一种较好的分类结果。由于高分辨率遥感影
信任模型是一种建立和管理信任关系的框架,它强调成员以及数据的可信性,通过对应用环境中的不端行为进行通告和限制,为用户能够更加合理的使用资源提供保证。目前信任模型在P
近年来,我国持续保持世界第一大出境旅游客源国和第四大入境旅游接待国地位,旅行成为了国人重要的生活方式,这使得国内酒店预定量激增。这些现象的背后除了旅游市场的日渐开
当今,以信息科学技术为先导的社会变革,全面推动着社会的发展,现代社会进入了以网络信息为中心的信息时代。作为国有大型企业的成都铁路局,建立以计算机技术、网络技术、现代
在遥感应用领域,面对遥感大数据,集群系统的引入,产生了很好的效果,保证集群的稳定性和可靠性非常必要。其中集群故障的及时检测和处理显得尤为重要。本文研究的内容,旨在为“遥感共性产品生产系统中的故障检测及处理”提供一个有效的策略方法。论文针对遥感共性产品生产系统中的故障检测和故障处理,进行了两个方面研究:一是根据目前系统的现状,提出一种故障检测的算法,该算法采用改进的DLHB心跳机制算法针对软硬件原因