论文部分内容阅读
语义网技术近年来越来越受到大型互联网公司、机构以及学术研究者的重视,随着语义网构建技术的发展,越来越多的语义网知识库涌现出来,并不断地在增长。如何对这些具有语义信息的数据进行快速检索进而利用这些数据逐渐成为语义网技术进一步应用发展的瓶颈,W3C组织已经公布了一种用于查询RDF数据的协议SPARQL(Simple Protocol and RDF Query Language),作为一个国际标准协议和查询语言,目前已经有许多数据库实现、API设计均支持该查询语言,然而对于语义网数据的消费者来说,查询语义网中的数据往往需要记住大量的语法细节,甚至语义网本身的本体设计,学习成本巨大。基于简化语义网查询的考量,本文提出了多种用户友好的、基于SPARQL语言的查询系统设计方案。该系统对需要检索的语义网数据库进行预处理,提取出URI相关联的label信息进行索引,从而可以结合当前普通用户使用传统搜索引擎的习惯,通过关键词(或自然语言)检索获取URI信息,进而生成具有用户查询意图的SPARQL查询语句,与语义网数据库进行交互。在对URI进行索引检索的过程中,本文提出一种基于字符串转换、字符串字面相似性计算结合的Top-K相似字符串检索方案,同时提出了一种基于图形化构件的,结合上下文语义信息的SPARQL查询语句自动生成方案,减少了用户查询语义网数据的学习成本,缩短了用户与语义网数据库的交互鸿沟。本文实现了一套基于SPARQL协议的语义网数据库查询系统,其中包括基于关键词的单实体语义信息查询子系统、基于多关键词的语义关联查询子系统、基于自然语言的SPARQL语句生成系统以及基于图形构建的SPARQL查询语句生成子系统。系统的测试实验显示,使用该系统能够方便地实现语义网信息查询。