PDF文档中JPEG图像的自动提取技术研究

来源 :信息工程大学学报 | 被引量 : 0次 | 上传用户:wei2859699
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
对PDF文档的处理常常要涉及到文本和图像的提取。文章在深入分析PDF格式和其中采用的各种压缩算法的基础上,实现了PDF文档中JPEG图像的自动提取。算法结合PDF文档结构和页面树,按照图像在页面中出现的顺序,对各页面中含有的图像对象进行准确定位,依次提取其中的图像压缩数据,并根据采用压缩算法的不同,对压缩数据进行筛选,最后得到保存为JPEG格式的图像。算法可以很好地应用于由任何途径生成的各种类型的PDF文档。
其他文献
高中生正处在从青年早期向青年中期和成年期过渡的时期.无论在生理上还是心理上,都在逐渐的趋向于成熟,如果能正确加以教育引导则会使其学有所成.成为合格的公民、劳动者。现就本
《数学课程标准》指出:教学应“从学生实际出发,创设有助于学生自主学习的问题情境,引导学生通过实践、思考、探索、交流等,获得数学的基础知识、基本技能、基本思想、基本活动经验”。因此,在课堂中创设恰当的教学情境,是数学来源于生活又服务于生活的现实体现。笔者结合初中数学教学实际,就新课标下教学情境的创设谈几点做法。  1.从实际生活中创设情境。  数学来源于生活,并广泛应用于生活的各个方面。教学中,从学
随着教育改革的不断推进,教师们也在不断探索新的、更加有效的教学方法。然而课堂时间总是有限的,学生集中注意力学习的时间也是有限的,过于复杂花哨的教学方式实际操作起来可能无法达到预期的效果,“简约教学”就是在这样的背景下提出的。若想建构数学简约课堂,就要做到“博观约取”,也就是说,教师要先广泛阅读,找到教材中的关键点、生长点和延伸点展开教学。  一、点击关键点,小组讨论  教学内容的关键点即重点,是学
兴趣是最好的老师。创新兴趣是培养创新意识的内在动力。如何培养学生的创新兴趣呢?我采取了下列方法:  1、直观效应法。在形声字教学中,我制作了一个轮盘,让学生边转动叶条边认识一组同一偏旁的形声字,学生兴趣很浓,识字效率大大提高。  2、成功激励法。教会了学生学习形声字的方法后,我鼓励学生自己用同类的方法去认识其他更多的字,他们感到了成功的喜悦,学习就更主动了。  3、赞赏评价法。每当学生认识了一组汉
文章在分析了平面回音壁模介质谐振器的特点以及它和微带线耦合的基础上,给出了一种新型的基于平面回音壁模介质谐振器的毫米波均衡器子结构。仿真分析证明,这种结构具有良好的
通信信号一般具有循环平稳性,利用信号的这种特性,循环MUSIC算法对于循环相关信号有很强的抑制干扰和噪声的能力,并且能够根据不同的循环频率来分离不同的信号,使其具有信号选择
经过近几年的新课改实践,许多教师在教学中,虽接受了新课改的理念,也在尽力按照课改的要求进行教学,对自己的教学内容精心设计,精心组织,但仍有许多不尽人意的地方,其表现在以下几个方面:  首先,在“理解数学”上做得远远不够。①数学知识上,许多高中数学教师对初中数学教材的掌握,仍停留在自己上初中学习时掌握的数学知识层面上,或者停留在数年前自己教初中数学时的水准上,至于新课改对初中数学内容做了什么调整,删
针对传统的信息过滤系统已不能满足快速信息过滤的需要的问题,以经典字符串模式匹配算法为基础,融入压缩编码和散列的思想,利用网络处理器高效并行处理的特点,提出了一种基于网络
为了抵消数字通信中的同频干扰,提出了一种基于单信道盲信号提取算法。不同于现有的盲信号提取盲分离模型,本文的模型除了利用数字信号过采样特性,还充分考虑了载波频率以及
网络交换设备的可重构性越来越受到人们关注,基于ForCES路由器体系架构,作为ForCES路由器软件的重要组成部分,文章提出了一种可扩展的LFB管理及开发模型。首先提出并叙述了ForCE