XSLC:基于分层编码并面向查询的XML数据压缩算法

来源 :NDBC2009第26届中国数据库学术会议 | 被引量 : 0次 | 上传用户:morningwind2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
XML文档已经被广泛用来作为应用程序的一个数据交换的格式。针对XML数据的压缩技术也成为一个新的研究领域。本文提出XSLC(XML Stream Layered-coding Compression)算法,通过预先扫描DTD对数据模式进行分析,继而根据元素的父子关系进行子元素层面中的编码,同时能够根据数据类型进行数据压缩,能够在压缩之后的文档上进行查询,而由于仅需一遍压缩扫描故可以应用于数据流环境。实验表明XSLC算法在基于通常情况的DTD上,压缩比率和压缩时间优于传统算法。
其他文献
燃煤电厂是烟尘、二氧化硫和氮氧化物等大气污染物排放的主要来源。近年来,国家相继制订出台了多项法律法规和技术经济政策,控制污染物排放。随着一大批大容量环保机组的新建或
目前,能源和环境问题已成为国际社会关注的焦点和制约中国经济快速发展的瓶颈,节能减排和低碳发展将是中国未来发展的必然选择。作为大型能源企业,如何发展洁净、低碳能源,在全球
本文简要介绍IGCC发电技术的主要特点,阐述了IGCC电站相比常规燃煤发电机组在二氧化碳捕捉上的主要技术优势,介绍了中国华电集团公司200MW级IGCC电站项目建设情况及技术研究进
全国电力行业“清洁高效燃煤发电技术协作网”2009年年会在春城隆重召开了,笔者代表中国大唐集团公司就大力发展清洁高效能源,提高清洁生产水平,推动可持续发展的做法和体会与各
煤炭具有复杂的成分和高的碳氢比,因而导致燃煤发电是S02,NOx,颗粒物和重金属等污染物的主要来源,也是我国C02最大的排放源之一。燃煤发电需要大量的煤炭,使我国资源的供需和交
长期以来我国电源结构不合理,过于依赖火电导致发电能耗大、污染重。在国家大力推进节能减排和清洁发电时候,国华电力根据国民经济发展规划、国家产业政策及市场需求,认真贯彻落
XML,的关键字检索简单易用,并且用户不必了解数据库的模式,近期受到人们的广泛关注。当前的相关研究主要集中于关键字检索的算法以及返回结果的组织和排序,然而却忽视了其中的安
会议
由于当前XML在数据交换和数据存储中的普遍应用,基于XML文档的信息检索研究已经成为新的研究热点。XML文档本身含有结构信息可以使其检索精度得到相当大的提高。但相应地,XML检
会议
对移动对象索引频繁更新问题进行了研究,提出了一种基于区域覆盖的空间索引结构虚拟网格四分树(VGQ),通过索引移动对象所在的区域而非移动对象本身来减少由于移动对象位置改变
数学教学不但要教学生如何掌握知识,更要让他们懂得如何创造知识;不但要教学生如何思考,更要让他们自由地思考.充满乐趣的数学课堂能够尊重学生的个性自由发展,激发他们用怀