XML压缩技术的研究与应用

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:lifengjun001
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
虽然对XML的某些技术标准尚有争议,但是人们已经普遍认识到XML的作用和巨大潜力,并将其应用到互联网的各个方面,如:数据交换、替代传统的电子数据交换、集成不同数据源、数据的多种显示等。XML特有的自我描述和平台无关等特性,使其在数据交换和不同数据源集成等方面的应用尤为突出。但是,XML格式的信息冗余过大,对磁盘空间、带宽都存在着浪费。为了有效地存储和交换XML数据,有必要对XML数据进行压缩。在传统的基本数据压缩算法的基础上,分析并结合XML文档的结构特点,给出了一种主要应用于数据交换和XML数据存档的高压缩率的XML文档专用压缩技术XCfde。根据XML文档自身特点,以基本数据压缩算法为基础,采取特有的四步压缩策略:重载SAX相关接口实现自己的XML解析器将XML文档分离为内容数据和结构数据,对结构数据进行字典编码;构建数据类型分类引擎,自动识别内容数据中包含的数据的类型(如整数、浮点数等)并且将内容数据根据其路径和数据类型进行分类后存入相应的容器;在传统算法的基础上设计不同的编码方法,对每个内容数据容器采取相应的编码方法进行初步编码处理;用7Zip压缩工具将初步编码后的内容数据和结构数据进行整合压缩,以期获得比较高的压缩率。此外详细描述了XCfde实现中的关键技术,包括数据类型分类引擎、中文压缩算法的改进等。将XCfde与流行的通用压缩工具和其它一些XML专用压缩工具进行压缩率对比,并且通过简单的网络应用程序范例模拟XML文档传输过程来展示XCfde的实际应用效果,测试XCfde在传输效率和性能方面的改善程度。从试验结果可以看出,XCfde的压缩率超过了现今流行的通用压缩工具和其它一些XML专用压缩工具,有效改善XML数据交换的传输速度和带宽利用率以及存档中的空间利用率。
其他文献
虚拟内窥镜技术是随着计算机图形学、图像处理、医学可视化和虚拟现实等学科的发展而逐步形成的一种独特的技术。它克服了传统内窥镜需要插入人体体内的缺点,是一种完全无接
随着网络技术的飞速发展,计算机网络被广泛应用到人类活动的各个领域,网络对社会经济和人们生活的影响越来越大。网络的安全性问题也越来越受到广泛的关注,各种网络安全相关
RSS是以XML为基础,用于为内容整合客户端提供选择性的、汇总过的Web内容的技术规范。由于RSS具有简单、规范、通用、容易自动生成等特点,因此越来越多的网站也采用这种方式来发
约束出现在很多实际应用之中,例如调度问题、迷宫以及组合优化问题等,MSVL是一种时序逻辑程序设计语言,能够对计算机系统进行建模、仿真与验证。但是,目前MSVL并不能被很方便的用
在我国冶金、石化、煤矿、港口、码头等重点行业领域中物品的运输量巨大,大多数企业货物的运输主要是依靠企业自备铁路实现的,由于企业铁路作业现场比较混乱,作业类型相当复
计算机技术和网络技术的发展和普及,大大推动了视频技术的发展和应用,数字视频技术在当前的信息社会中日益发挥着重要的作用。同时,视频图像的编码和传输技术面临巨大的挑战。实
随着软件复杂性的快速递增和软件开发的全球化趋势,开发高质量的SRS日益成为软件开发中的核心问题。越来越多的实践证明,全面的过程管理是提高产品质量的有效途径,且软件过程
利用虚拟现实技术,模拟传统的实验方法,开发网上教育的虚拟实验,已经成为现代教育的关键环节。虚拟实验本质特征在于利用网上虚拟现实技术的沉浸性、交互性和多感知性,模拟传
食品安全问题是全世界人民共同关注的热点问题,对于人类的生存和发展有着极其重要的意义。我国的农林业生产规模和农林食品产量都位居世界前列,耕地面积占世界耕地总面积的7%,林
粒计算是信息处理的一种新的计算模式,涉及到如何利用粒来求解问题的方法,时间序列的挖掘作为数据挖掘的一个课题正引起广泛而深入的注意。论文针对时间序列挖掘的问题,用粒的观