基于分级树形索引的关联数据压缩研究

来源 :武汉科技大学 | 被引量 : 0次 | 上传用户:ren198525
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着语义网技术的不断发展和应用,大规模RDF数据集的使用也越来越频繁,在管理这些大规模数据集时,由于RDF数据集的体积问题,查询和管理的性能会受到很大影响。因此,对于大规模RDF数据而言,高效率的存储方法显然是很重要的。对于数据的压缩存储而言,本质上是去除数据里包含的冗余信息内容。目前,对于大规模RDF数据的压缩存储,其处理思路可以分为以下两种:基于数据模型层次的压缩处理和基于序列化层次的压缩处理,其中,基于序列化层次的压缩处理思路又可以细分为语法结构压缩和字符压缩。本文从RDF数据的序列化层次出发,通过对当前RDF压缩存储技术进行分析总结,提出了一种基于关系三维矩阵的分级树形索引压缩模型。该模型利用分析和提取RDF标识间的关系来构建字典,将三元组映射为ID三元组。通过分析关联数据集自身的关系三维矩阵分布结构,结合分级树形索引的存储思路,解决矩阵存储的结构冗余问题,实现对数据集的序列化压缩。此外,本文还分析总结了该压缩模型查询对关联数据基本查询模式的匹配。通过实验验证与结果分析表明,本文提出的压缩存储模型能够有效提高RDF数据的压缩效率,同时也实现了很好的查询效率。
其他文献
随着我国经济的飞速发展以及科技水平的不断提高,城市化的进程不断加快,绿化用地也愈发紧张,为保障城市的生态环境,提高人们生活场所的舒适性,各种新型绿化呼之欲出,运用到绿
气候敏感度是衡量全球温度变化和温室气体浓度变化关系的重要指标。目前,对瞬时气候响应(TCR,或称气候敏感度)的模拟存在较多的不确定性。本文从海洋热吸收变化的角度讨论海
随着经济全球化,贸易自由化的不断深入,金融机构间的联系越来越紧密。金融网络在壮大的同时也使得金融危机发生的更加迅速。在金融危机期间大量的基金产品会发生巨大的回撤,
本文从单井地层划分入手,通过大量的钻井、化验等资料,利用井震结合准确标定层位,精细刻画断层,实现断层合理组合,分析构造发育史,提高构造图精度。在此基础上,通过单井沉积
高性能计算(HPC)通常是使用一定数量的处理器或通过网络管理集群中的若干台计算机这样的环境来对问题进行计算。并行计算是解决高性能计算问题的其中一种方式,它能让多条指令
本文在SOC可重用设计方法学的理论基础上,提出了基于IP核的可视化设计方法。该设计方法包括可视化IP核管理、可视化IP核调用、可视化IP核配置和可视化模块连接,同时提出了IP
河口沙洲是重要的湿地资源,对于沙洲面积的估算及其演变一直是人们关心的问题。但由于河口地区复杂的动力因素,海洋测绘难以获取河口沙洲Om线海图基面,并且耗时较长、花费昂
现如今,伴随着移动互联网技术的快速发展,计算机高速运行极大地提高了计算、逻辑判断和存储功能等方面的能力。面对电子商务和互联网金融等领域产生的大量数据,在“人工智能
研究癌细胞系对抗癌药物的反应是理解癌症生物学和研发新型抗癌疗法的关键,在癌症治疗中起着至关重要的作用。传统的研究癌细胞系-药物反应方法是基于临床实验的,这是一个时
高效能开展“三助”工作,需要对“三助”岗位进行科学的定位,最重要的是建立完善的管理制度和办法,不仅可以帮助“三助”工作的实施,而且还能节约资源、提高效率。本文运用问