PDF文档中JPEG图像的自动提取技术研究

来源 :信息工程大学学报 | 被引量 : 0次 | 上传用户：wei2859699

【摘要】

：

对PDF文档的处理常常要涉及到文本和图像的提取。文章在深入分析PDF格式和其中采用的各种压缩算法的基础上，实现了PDF文档中JPEG图像的自动提取。算法结合PDF文档结构和页面树

【作者】

：

陈云榕刘立柱叶晗

【机构】

：

信息工程大学信息工程学院

【出处】

：

信息工程大学学报

【发表日期】

：

2007年2期

【关键词】

：

PDF文档 JPEG图像文档结构页面树压缩算法 PDF document JPEG images document structure page t

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

对PDF文档的处理常常要涉及到文本和图像的提取。文章在深入分析PDF格式和其中采用的各种压缩算法的基础上，实现了PDF文档中JPEG图像的自动提取。算法结合PDF文档结构和页面树，按照图像在页面中出现的顺序，对各页面中含有的图像对象进行准确定位，依次提取其中的图像压缩数据，并根据采用压缩算法的不同，对压缩数据进行筛选，最后得到保存为JPEG格式的图像。算法可以很好地应用于由任何途径生成的各种类型的PDF文档。

其他文献

发展特点的教育措施针对高中生心理

高中生正处在从青年早期向青年中期和成年期过渡的时期．无论在生理上还是心理上，都在逐渐的趋向于成熟，如果能正确加以教育引导则会使其学有所成．成为合格的公民、劳动者。现就本

期刊

心理发展特点教育措施高中生班主任工作教育引导高中学生教育教学成年期

新课标下教学情境创设的几点做法

《数学课程标准》指出：教学应“从学生实际出发，创设有助于学生自主学习的问题情境，引导学生通过实践、思考、探索、交流等，获得数学的基础知识、基本技能、基本思想、基本活动经验”。因此，在课堂中创设恰当的教学情境，是数学来源于生活又服务于生活的现实体现。笔者结合初中数学教学实际，就新课标下教学情境的创设谈几点做法。　　1.从实际生活中创设情境。　　数学来源于生活，并广泛应用于生活的各个方面。教学中，从学

期刊

教学情境创设新课标《数学课程标准》学生自主学习基本活动经验实际出发问题情境引导学生

博观约取，建构数学简约课堂

随着教育改革的不断推进，教师们也在不断探索新的、更加有效的教学方法。然而课堂时间总是有限的，学生集中注意力学习的时间也是有限的，过于复杂花哨的教学方式实际操作起来可能无法达到预期的效果，“简约教学”就是在这样的背景下提出的。若想建构数学简约课堂，就要做到“博观约取”，也就是说，教师要先广泛阅读，找到教材中的关键点、生长点和延伸点展开教学。　　一、点击关键点，小组讨论　　教学内容的关键点即重点，是学

期刊

简约课堂小组讨论条形统计图数学学习简约教学折线统计图

培养学生创新兴趣四法

兴趣是最好的老师。创新兴趣是培养创新意识的内在动力。如何培养学生的创新兴趣呢？我采取了下列方法：　　1、直观效应法。在形声字教学中，我制作了一个轮盘，让学生边转动叶条边认识一组同一偏旁的形声字，学生兴趣很浓，识字效率大大提高。　　2、成功激励法。教会了学生学习形声字的方法后，我鼓励学生自己用同类的方法去认识其他更多的字，他们感到了成功的喜悦，学习就更主动了。　　3、赞赏评价法。每当学生认识了一组汉

期刊

创新兴趣培养学生创新意识老师

基于平面回音壁模介质谐振器的毫米波微带均衡器

文章在分析了平面回音壁模介质谐振器的特点以及它和微带线耦合的基础上，给出了一种新型的基于平面回音壁模介质谐振器的毫米波均衡器子结构。仿真分析证明，这种结构具有良好的

期刊

回音壁模介质谐振器均衡器Whispering-gallery Modes Dielectric Resonators Equalizer

宽带循环MUSIC

通信信号一般具有循环平稳性，利用信号的这种特性，循环MUSIC算法对于循环相关信号有很强的抑制干扰和噪声的能力，并且能够根据不同的循环频率来分离不同的信号，使其具有信号选择

期刊

循环平稳波达方向估计宽带循环MUSICcyclostationary DOA wideband cyclic MUSIC

从“理解数学教学”的角度看初中数学与高中数学的衔接

经过近几年的新课改实践，许多教师在教学中，虽接受了新课改的理念，也在尽力按照课改的要求进行教学，对自己的教学内容精心设计，精心组织，但仍有许多不尽人意的地方，其表现在以下几个方面：　　首先，在“理解数学”上做得远远不够。①数学知识上，许多高中数学教师对初中数学教材的掌握，仍停留在自己上初中学习时掌握的数学知识层面上，或者停留在数年前自己教初中数学时的水准上，至于新课改对初中数学内容做了什么调整，删

期刊

数学教学高中数学初中数学衔接精心设计教学内容课改教师

基于网络处理器的快速文本信息过滤

针对传统的信息过滤系统已不能满足快速信息过滤的需要的问题，以经典字符串模式匹配算法为基础，融入压缩编码和散列的思想，利用网络处理器高效并行处理的特点，提出了一种基于网络

期刊

网络处理器模式匹配过滤Network processor pattern matching filter

一种基于盲信号提取的同频干扰抵消算法

为了抵消数字通信中的同频干扰,提出了一种基于单信道盲信号提取算法。不同于现有的盲信号提取盲分离模型,本文的模型除了利用数字信号过采样特性,还充分考虑了载波频率以及

期刊

同频干扰盲信号提取广义峭度恒模算法co-channel interference BSE generalized kurtosis CMA

一种可扩展的ForCES路由器LFB管理及开发模型

网络交换设备的可重构性越来越受到人们关注，基于ForCES路由器体系架构，作为ForCES路由器软件的重要组成部分，文章提出了一种可扩展的LFB管理及开发模型。首先提出并叙述了ForCE

期刊

路由器转发和控制分离LFB管理模型可扩展router ForCES LFB manager model extensibility

PDF文档中JPEG图像的自动提取技术研究

与本文相关的学术论文