面向语义网的自然语言查询接口研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:yushilv
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目前,互联网上的数据呈爆炸式增长态势,海量的数据对数据存储和信息获取带来了前所未有的挑战。语义网被认为是下一代互联网的存储方式。以语义网形式描述的数据不仅可以被人们理解,而且可以被计算机所理解。数据在语义网中是互相链接的,彼此之间被语义标签链接起来,形成一个巨大的语义网络。现在,越来越多的数据以语义网的形式发布出来,但是对于普通用户而言,从语义网中获取信息的难度远超过目前的搜索引擎。语义网目前仅支持形式化查询,而且只有对语义网本体熟悉的专业人员才能够编写正确的形式化查询。对于普通用户而言,自然语言形式的查询是最便捷、最易接受的查询方式。自然语言查询接口作为一个连接自然语言查询和语义网形式化查询之间的桥梁,具有重要的研究价值和实用价值。如何有效的将用户的自然查询问句转化为能够查询语义网的形式化查询语言是本文的主要研究内容。本文针对这一问题研究了英文和中文两种语言上的自然语言查询接口任务。本文主要贡献如下:首先,在对查询的形式进行充分分析之后,发现问题的形式具有链式规则,即查询中匹配的资源只与其前后资源存在联系,因此,本文根据这一假设,提出了一种基于资源补全搜索的自然语言查询接口方法。该方法在形式固定、语法简单的问题上取得了较好的实验结果。其次,在对资源补全搜索方法的实验结果分析之后,我们发现资源补全搜索算法不能处理语法复杂的问题,且没有考虑查询中的语义信息。因此,我们提出了一种基于依存图的自然语言查询接口算法,旨在充分利用查询中的语义信息来指导形式化查询的生成。该方法的性能在美国地理数据集上较资源补全搜索方法有较大的提升。为了测试基于依存图的自然语言查询接口算法对不同语言环境的适应能力,我们在中文数据集上又进行了实验。分析结果得出,基于依存图的算法在英文上的效果要优于中文上的效果。实验表明,基于依存图的方法在自然语言查询到语义网形式化查询的转换的任务上取得了很好的效果,同时,证明了自然语言查询接口能够有效的完成搜索语义网信息的任务。
其他文献
随着生活和工作节奏的加快,人们需要从繁杂的家庭劳动中解脱出来;同时随着全球性人口老龄化的发展,更多的老人需要照顾,为此,集清扫、娱乐、辅助等功能于一身的家庭机器人研
为了考察串联式混合动力城市公交车的动力性和经济性,应监测整车的运行情况,需要对行驶过程中车上各个部件的参数变化进行采集、分析,因此数据的采集控制对整车的监测与调试
随着Internet的不断发展,网络安全已经逐渐成为人们越来越关心的问题,而入侵检测作为一种重要的网络安全防护手段,越来越受到广大学者和工程人员的重视。入侵检测技术包括误
随着Internet的发展,网络信息爆炸和人们日益增加的信息获取需求矛盾暴露出来。网络信息检索技术成为了社会研究的热点技术,其中搜索引擎技术更是蓬勃发展。本文主要对新兴出现
大型信息系统通常十分复杂,人们经常借助模型来分析设计系统,但传统建模方法己越来越不适应现代信息系统日渐复杂和多变的需求。九十年代以来,面向对象己成为软件工程领域的主流
油气田开发生产过程中,每天都会产生大量的生产数据信息,这些数据信息逐年累积后逐步形成海量数据,如何从这些信息中把有价值的数据抽取出来进行有效利用,为油气田开发生产提供决
随着网络通讯活动的日益频繁,诸多保障网络数据传输安全的技术随之应运而生,虚拟专用网VPN(Virtual Private Network)就是其中一种较为有效的技术。由于基于安全套接层SSL(Se
从1964年图形学诞生以来,虚拟现实研究一直是计算机图形学研究的一个重要分支。虚拟现实技术已经在各个领域得到了广泛的应用,尤其是在数字娱乐产业如影视工业,游戏工业,虚拟训练
近年来,由于在三维电视、自由视点电视、视频监控和视频会议等诸多交互式多媒体领域具有广泛的应用前景,多视点视频技术受到人们越来越多的关注。作为新型媒体,交互性是多视
随着近年来大规模存储、高性能工作站以及宽带网络等技术突飞猛进的发展,流媒体点播服务从技术上和经济上成为可能,大大丰富了互联网中的内容。然而传统的客户端服务器(C/S)架