【摘 要】
:
资源描述框架(Resource Description Framework,简称RDF)是语义Web中所使用的基本标记语言,在知识的组织与管理和社会网络应用中广泛应用。RDF数据的规模随着语义Web应用的发
论文部分内容阅读
资源描述框架(Resource Description Framework,简称RDF)是语义Web中所使用的基本标记语言,在知识的组织与管理和社会网络应用中广泛应用。RDF数据的规模随着语义Web应用的发展而增大。RDF数据具有典型的图特征,含有复杂的结构信息,以及大量的文本信息。可见,如何在大规模RDF数据上进行高效的关键词查询是当前研究的热点之一。针对已有研究在查询执行效率和结果质量方面存在的不足,提出了基于近似组斯坦纳树的大规模RDF数据关键词查询方法RAGS。RAGS将RDF上的关键词查询映射为组斯坦纳树问题,然后通过将组斯坦纳树问题规约为最小斯坦纳树问题进行求解。针对经典的最小斯坦纳树算法是非规约安全的问题,提出了改进方法,并分析了算法的时间复杂度和近似比性能。为了使大规模RDF数据上的关键词查询具有更友好的用户体验,设计了最短路径三元组倒排索引结构,通过离线预先计算全源最短路径的方式,改善在线查询的实时性;提出基于升序排列生成树算法的top-k查询方法,以便更快的为用户返回准确结果。考虑到对于大规模RDF数据而言,索引构建时间也是系统的主要瓶颈。提出基于整体同步并行计算模型(Bulk Synchronous Parallel,简称BSP)的全源最短路径分布式并行算法,加快索引的构建。实验显示,RAGS在时间性能和结果质量方面具有较好的性能,基于BSP的分布式算法具有较好的可伸缩性。
其他文献
随着互联网应用和计算机技术扩展到社会生活的各个方面,数据量呈现出爆炸式的增长。今天,存储和处理大规模数据和超大规模数据已经成为企业面临的全新挑战。为此,行业内提出
近年来,虚拟化技术以其能够很好的屏蔽底层硬件资源的异构性,具有提高资源使用效率,增强系统弹性和可扩展性,减少硬件投资及管理维护成本等诸多优势而被广泛的应用于资源服务
测试确保软件的正常运行,好的测试方法具有发现缺陷的高可移植性,而且还可以保证测试用例设计得经济有效,执行测试用例的开销尽可能的小。介绍了主要的三种测试方法,黑盒测试、白
多播技术已有广泛的应用。对于实时性要求高的多播应用,多播路由必须保证服务质量。为此,本文研究保证服务质量的多播路由问题,并提出三个多播源路由算法以保证服务质量。
网络教育(E-learning)已经成为改革传统教育模式的强大动力和有效手段。网络教育突破传统学校教学方式的时空束缚,因此与其他教育形式相比较,网络教育具有更加独特的作用。20
本文基于状态估计中滤波和数据关联的理论基础,针对火炮系统中跟踪雷达得到的原始目标数据进行平滑、滤波和预测;扫描雷达得到的原始目标数据进行数据关联,达到提高目标跟踪
分布交互仿真(DIS)是当前仿真技术研究的重要领域之一,其深远的工程应用价值,尤其在军事领域的应用价值,已引起世界各国的广泛重视。其中关键因素——网络传输部分的解决,在
本文从以下几个方面进行研究。 第一,针对目前软件柔性概念不清和柔性的度量无从下手的现状,对柔性软件及软件柔性的概念和内涵进行了深入系统的研究;在总结了人们对柔性的认
嵌入式系统的Internet接入技术是目前嵌入式系统研究的发展方向。Internet现已成为社会重要的基础信息设施之一,是信息流通的重要渠道。嵌入式系统连接到Internet上面,可以方便
高科技产业的迅速崛起带动整个社会的进步,更促进互联网的飞速发展。然而,网络世界也日益暴露出很多棘手的问题。其中有网络架构、硬件设备等客观因素,也有病毒程序等人为破