面向PDF文档的图像恢复系统的设计与实现

来源 :湖南大学 | 被引量 : 0次 | 上传用户:zhut2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术、Internet的迅猛发展,人们可以很方便地获得所需的电子资料,其以文档形式储存在计算机中,而使用较为广泛的一种文档格式就是PDF。然而由于从纸质材料转换成电子文档的原因,PDF文档中经常出现字迹断裂,不清晰等情况。本文主要对这些PDF文档进行图像恢复与增强处理,从而提高其阅读质量。   本文主要研究内容如下:   1.分析了低质量PDF文档出现污渍的成因,介绍了噪声监测的MADM方法,并且为减少PDF文档的噪声而设计了开闭噪声滤波器方法。   2.基于扫描仪成像原理,分析扫描成像可能出现模糊的成因,基于扫描成像的特性,结合一次成像中的运动模糊恢复方法设计了扫描成像模糊图像恢复算法。   3.对比分析了扫描成像文字与手动输入文字的PDF文档的区别,分析了字迹断裂的形成原因。针对PDF文档的字迹不清晰,设计了滑动窗口各向异性插值算法。   本文基于Visual Studio.Net集成开发环境与OpenCV库,使用C++语言编写了PDF文档恢复系统。该系统可以对5类受污染文档进行恢复,分别是存在污渍、扫描倾斜、图像不清晰、文档模糊、字迹断裂。运行结果表明,恢复的图像比较令人满意,比恢复前的图像具备更好的可阅读性。   关健词:PDF文档;椒盐噪声;运动模糊;图像恢复;维纳滤波;各向异性插值
其他文献
数据挖掘技术在众多领域得到了广泛地应用。其中,在健康医疗领域产生的数据,数量巨大且形式复杂,无法通过传统的方法进行分析和处理。因此,本论文将尝试采用数据挖掘方法和技
随着Web成为世界上最大、类型最齐全的海量信息库,以企业运营分析决策为主的商务智能发展到了一个新的层次。Web作为商务智能系统至关重要的数据来源,但是Web数据在质量上还
阻抗成像技术是一种基于生物内部电阻抗分布的成像技术,属于无创生物检测技术的重要分支。因其无创性和早期诊断的优势成为目前生物医学领域的研究热点,其无损检测在工业检测
随着云计算集群规模的快速扩张,其所带来的能量消耗和成本越来越巨大,不论从经济角度还是环保角度,如何降低集群的能量消耗,实现“绿色计算”,已经成为急需解决的问题,“绿色
水下传感器网络是一门新兴的网络技术,它是全球网络化技术普及的产物。国内外对水下传感器网络的重视程度不断升温,并对其进行了深入的研究。水下传感器网络通常是由水下传感
随着企业管理的信息化以及GIS的发展和大众化,越来越多的企业(如通信行业、电力部门等)需要在公司的内部管理系统中集成GIS,来有效、直观地管理通信线路、通信设备等,而MapIn
Ajax是Web领域的前沿技术,它提供了新的互联网交互模型,大大扩展了web应用的能力,但存在一些问题限制了Ajax技术的应用。Ajax Web应用的设计方法、模式的研究还刚刚起步,由于
摘要:随着图像传感技术和信息融合技术的发展,多传感器融合技术也得到了越来越广泛的应用。低光照条件下,红外传感器和微光传感器的使用能很好地弥补人类自身生物视觉上的缺陷
生物特征识别技术凭借其安全高效、智能准确和应用广阔等特点赢得了人们的广泛关注和高度重视。掌纹识别是近年新发展起来的一种生物特征识别技术,除具传统生物特征识别技术