海量RDF数据的分布式存储研究

来源 :西安建筑科技大学 | 被引量 : 0次 | 上传用户:wangjie198811
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着Web数据和各种网络资源剧增以及语义网的兴起与发展,海量RDF(Resource Description Framework,资源描述框架)数据存储已成为当前Web数据存储领域的研究热点。作者在深入学习和研究了当前流行的若干分布式存储框架后,提出了海量RDF数据分布式存储的一种解决方案,并在linux集群上实现了高效、协作地海量RDF数据存储。首先,作者在深入对比分析了若干种分布式存储框架之后,结合本项目的特点,选定了开源存储框架Hbase (Hadoop DataBase, Hadoop数据库),实现了把海量稀疏的RDF数据集中存储在一个Hbase表中,这样不仅解决了传统关系数据库的低效率联合查询问题,并且我们还可以在分布式平台上使用MapReduce并行算法加快处理速度。其次,论文剖析了开源框架Hadoop分布式数据平台以及语义网基础框架Jena,并依托于此框架完成RDF/XML文档的解析和RDF模型的创建、以及一些模型的语义分析,作者几乎重写了Jena所有存储方面的底层代码,使得把数据的存储迁移到分布式平台,还重写了Jena模型解析和查询的部分代码,使其能充分发挥分布式处理的强大作用。加快查询效率和处理速度,这也为快速发展语义网奠定了基础。最后作者总结了整个项目的研究结果,结合自己的研究方向,提出了将来的研究目标和展望。
其他文献
随着计算机和通信技术的高速发展,网络规模的不断增大,各种网络的应用越来越广泛,与此同时网络安全问题也困扰着人们。传统单一的防御技术已经无法应对层出不穷的网络安全事
计算机网络的快速发展使人们面临日益严峻的网络安全问题,入侵检测作为一种积极、有效的网络安全手段,能够有效弥补防火墙的缺点。基于人工免疫的入侵检测系统借鉴了生物免疫
随着计算机和网络的广泛应用,工作流技术已经成为人们的日常业务处理中越来越重要的技术。工作流管理系统作为工作流技术的软件载体,它的主要目标是通过调用有关信息资源与人力资源来协调业务流程中的各个环节,使其按照一定的顺序依次执行,从而实现业务流程的自动化。由于工作流管理系统多数情况下是运行在异构、自治、分布的复杂环境中,其自身的正确性和可靠性成为制约整个应用软件系统成败的一个关键因素。在工作流管理系统中
随着无线通讯技术和移动通讯技术的不断发展,移动Ad hoc网络技术因其无需预设基础设施的支持,灵活方便的移动自组等特性,迅速得到了发展。如何实现移动自组网络中数据的高效
近年来,随着计算机技术的迅速发展和微电子工艺水平的提高。工业控制领域中自动化及智能化程度水平越来越高。各种各样的新型技术的出现不断代替传统的控制理论。将视觉定位
近年来,曲面重建在机械制造、虚拟现实、计算机视觉等领域得到了广泛地应用,受到了国内外学者的普遍关注。三维激光扫描仪在CAD/CAM的广泛使用使得表征模型特征的点云数量更
免疫细胞因子网络不仅是生物学领域的研究热点,而且也是生物学领域的研究难点。尽管已经有相当多的人对其开展了深入地研究,并且同时也获得了许多重要的研究成果,但是人们大
随着计算机技术的迅速发展,USB移动存储设备的使用近年来迅速普及,给各种类型的用户带来很大方便的同时却成了政府和企业内部信息泄露主要途径之一,USB移动存储设备对内部信
自然场景实时交互技术是一种能表达自然场景的真实感,同时给用户极强的沉浸感的元素。自然场景的交互式实时渲染已成为目前的研究热点,尽管目前已取得了不少成果,但是早期的
软件运行出现故障之后,软件故障定位非常困难。传统的软件定位方法主要是结合测试技术,使用有针对性的测试,发现软件中存在的特定缺陷,再利用其他辅助技术找出故障原因并定位