汉王新系统可编辑１１种ＰＤＦ文档

来源 :中国计算机报 | 被引量 : 0次 | 上传用户：tongys

【摘要】

：

【作者】

：

李锋白

【出处】

：

中国计算机报

【发表日期】

：

2007年50期

【关键词】

：

汉王文档文件图像文本格式

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

　　在我国电子政务建设过程中，以PDF为格式的电子文档得到了广泛的应用。相比较而言，PDF具有许多其他电子文档格式无法相比的优点，如完全保持纸质文档原样、存贮空间小、便于网络传输等。
　　
　　问题：PDF文档无法编辑
　　
　　作为一种图像格式，PDF的只读特性为它带来了缺陷：只能看，无法进行文本编辑、复制和引用，PDF文档之间也无法相互引用和检索，大量文档只能是一堆死的文字，而不是可应用的流动的信息。这些成为电子政务应用中的一个老大难问题。
　　这个问题该如何解决？面对不同部门、不同内容的PDF文档，如果要拷贝和检索，要将全部信息进行统一整理和归类，政府部门可以采取的一种办法就是用人工方式将它们重新整理录入，统一制作成某种文本格式(如Word 或txt)。显而易见，如果采用人工录入的方式，不但占用了大量人力和时间，消耗了宝贵的政府资源，还会因人工录入而产生较高的错误率，从而对政府信息传递的有效性产生不良的影响。
　　据汉王科技副总裁李志峰介绍，早在2002年，汉王就以敏锐的市场洞察力觉察到了各级政府机关面临的这个老大难问题，并率先提出了解决该问题的思路。从那时起，如何使政务信息流动得更通畅、信息利用率变得更高，如何更好地帮助政府机构实施电子政务工程，这些问题就一直萦绕在汉王人心头。在随后的几年里，汉王一方面密切关注政府机关PDF文档转换为文本文档的现实需求，另一方面積极组织大量科研人员进行难题攻关。
　　
　　创新：实现格式转换
　　
　　近期，汉王科技应用OCR领域的最新技术，推出了全新的汉王PDF图像OCR识别系统。该系统支持打开多种编码方式的PDF文件，将PDF页面完整地转换成图像，然后在系统中将其识别为可编辑的文本。用户根据需要对识别出的文字、图片、表格数据进行修改调整，并保存为Word、RTF、Excel、txt、普通PDF、双层PDF等文件格式。
　　该系统为政府办公量身打造，无缝整合了PDF文档录入、图像处理、版面分析识别和文本转换的全过程，使得大量PDF格式文档无法编辑、复制和检索的难题迎刃而解，彻底解决了PDF格式文档内容检索的老大难问题。
　　通过应用汉王PDF图像OCR识别系统，政府机构多版本的PDF文档都可以成为单一的文本格式，可以加强政府机构对文档进行科学且高效管理的能力，充分实现各类信息的在线检索、查询、浏览和阅读功能，从而为海量信息的交叉检索、内容的进一步发掘提供了现实可能性。
　　据悉，汉王PDF图像OCR识别系统可以涵盖全部11种PDF图片存储格式，在对PDF文档进行检索与编辑的时候，还可以保留原始文件。此外，公式识别曾经是业界公认的大难题，许多PDF文档也存在这个亟待解决的问题，即复杂的数学、物理公式及化学反应方程式的识别和转化。对此，李志峰表示，汉王PDF图像OCR识别系统也成功解决了PDF文档格式中公式识别的问题。目前，该系统已经在多个中央部委中得到了应用，同时也引起了诸多地方政府机构的关注。
　　
　　链接: 关于PDF
　　
　　PDF(Portable Document Fromat)文件中文名称为可携式文件，是一种平台无关的结构化文件格式，无论原始文件采用的字体、图像格式如何，生成后的PDF文件可以在Windows和Linux系统下精确呈现出文件原有的效果。
　　PDF文件数据组织形式灵活多样，可用多种编码方式对文本图像数据进行编码，并可以对文件数据进行加密。这使得PDF文件在显示印刷、存储空间、网络传输、信息安全等方面都优于其他众多的电子文档格式。
　　PDF编码方式目前有ZIP、LZW、CCITT、JPEG、JPEG2000等。

其他文献

怎样从会计升至ＣＦＯ

在国内，相对其他领域来说，信息化在财务领域的应用是比较早的，从会计电算化到ERP的财务业务一体化，财务人员一直在品尝信息化的甜头。信息化在工作效率、工作方法上给财务人员带来惊喜的同时，对财务人员职业瓶颈的突破也起着重要的作用。　　一般来说，财务人员的职业发展有两种选择：一种是选择外部服务机构，如会计师事务所或税务师事务所，走的是专业路线；另一种是选择在企业内部财务部门供职，经历会计员→财务主管→财

期刊

财务部财务人员公司系统财务费用

不要理论　要实战

IT业界竞争日益激烈。参加培训，提升自身素质，成为IT从业人员乃至企业在竞争中胜出的最常用招数。那么，什么样的培训会吸引他们呢？　　无论是想要跳槽，还是想让自己的职业生涯更上一层楼，IT人士总能在各类培训大军中扮演重要的角色。那么，他们到底希望得到什么样的培训，培训过程中让他们头痛的问题又是什么呢？　　　　工作需要是动力　　　　调查发现，IT从业人员参加培训都跟自身工作的需要有很大的关系。他们或是

期刊

自己的工作培训机构公司参加培训时间

证券风险防范与ＩＴ内审

建立一套完整贯穿审计业务的前台和后台的审计信息系统，是公司重要的内审手段。　　当前证券市场交易量的持续攀升考验着各式各样的交易系统，这时，IT内审被推到了关键位置。　　内部审计在证券公司经营管理中处于极其重要又特殊的地位，它是内部控制系统的重要组成部分，也是企业监督与评价内部控制的主要手段。设立内部审计部门是企业建立自我约束和监督机制的一种措施，是提高核心竞争力以及确保资产保值增值的内在需要，也是

期刊

系统信息系统内审主要包括内部审计业务

戴尔服务七年成长

在戴尔2006财年的财务报告上，戴尔服务业务再次为其写下了一个漂亮的数字。在戴尔公司的600亿美元的全球收入中，IT服务收入达到50亿美元，占整个收入的9%，同时，2006年戴尔IT服务的增长率达到了36%，在戴尔涉及的各项业务中高居榜首。　　七年来，戴尔服务业务以10倍于行业增长率的速度高速发展，并在戴尔整体战略和总体收入中占据重要地位。比较三年前，戴尔服务的规模增加了两倍。戴尔公司中国及香港

期刊

戴尔大路客户需求目标系统

网格计算让安全变得更为复杂

清华大学提出的网格系统框架图　　虽然目前网上已有成千上万台计算机，也有为数众多的高性能计算中心，但是，网络资源的利用率却不高。据统计，网络系统的平均利用率仅为30%左右。如何更好地利用网络资源已经成为人们日益关注的话题。通过努力，科学家们终于想到了解决问题的方法——利用网　　格计算(Grid Computing)，把网络上的计算机组织起来，形成一个巨大的全球计算环境。　　　　网格的安全特点和需求　

期刊

网格资源环境单点用户技术

直击数字化庭审现场

异地举证、全程录像、同步视频……庄严的法庭演绎一幕幕生动的镜头，于庄重与严谨之中维护司法公正。　　司法公正体现社会公平正义,法庭庭审体现司法之公正并扮演控辩双方较量之焦点的角色。在庭审活动中，法院如何以信息技术手段服务于审判的公正高效？如何维护当事人权益，确保司法正义？数字法庭带来的庭审变革如何带动法院的整体变革？这些变革又如何体现法院司法实践的发展方向？　　李法官第二天要参加物业纠纷案的开庭，

期刊

法庭法官笔录小王书记员两人

ＡＭＤ看好节能技术

7月8日，AMD公司宣布，将对节能芯片厂商全美达注资750万美元。作为回报，AMD将获得全美达部分优先股。消息一传出，全美达股票当天的收盘价上涨了34%，AMD的股价也出现小幅上涨。业内普遍认为，AMD与全美达再次携手，对于双方而言，都是一个不错的选择。　　　　昔日对手今日伙伴　　　　现在很多人对全美达这个名字可能会感到陌生，但在上世纪90年代末期，全美达在处理器市场也是声名显赫。　　可以说，从

期刊

全美达市场处理器芯片美达电脑

揭密微软桌面电脑

人们终于可以亲身体验电影《少数派报告》里汤姆克鲁斯用手随意拨动影像的场面了！5月30日，微软公司公开展示了一台新型电脑——与众不同的是，这是一台桌面电脑(Surface)，它既没有鼠标，也不需要键盘，而是通过声音、笔或者触摸进行操作。　　微软创始人比尔盖茨曾示，要让全球每个人桌上都有一台电脑。而此次微软推出的Surface则直接把桌面变成了电脑。　　Surface大如茶几，高22英寸、长42英寸、

期刊

微软桌面的是多点电脑顾客

ＨＲ－ＢＩ　让ＨＲ经理用数据说话

图1 量化管理支持HR战略转型　　　　图2 HR-BI数据流　　　　图3 人力资源信息化整体蓝图　　越来越多的CEO们认识到当今企业竞争力的核心是人力资源,人力资源职能面临着新的、更具有战略性衡量标准的挑战。CEO们经常期盼HR有能力为企业提供所有员工的数据和分析，从而提高企业商业决策的准确度和企业竞争力。人力资源管理与企业效益之间关系的研究是当今人力资源管理领域的重要课题，但到现在为止还未有得到

期刊

数据人力资源人力资源管理系统企业部门

品味ＳＭＡＲＴ“晶”彩

6月19日，飞利浦随其第八代液晶显示器产品发布了其最新的SMART技术。该技术可以在显示器其他参数不变的情况下，使液晶显示器所表现出的色彩更为细腻逼真，并使液晶画质在优化后能适应多种不同的应用场所，让用户得到更方便快捷的应用体验。　　液晶在工作时其默认性能并非最优，对于每台显示器来说，需要经过细致的调节。之前，专业显示器在出厂前需要经过专业的调试工程师对液晶的显示效果进行细致的调节，而这也正是专业

期刊

显示器飞利浦技术液晶最优显示效果

汉王新系统可编辑１１种ＰＤＦ文档

其他学术论文