基于关键词的语义搜索

被引量 : 0次 | 上传用户:arnohuang123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语义搜索虽然提出多年,但是为了能够运用精确的语义搜索技术,用户必须熟知本体中的结构和相应的知识表示,并且具备写形式化查询语言的能力。所以目前语义搜索的应用人群往往还停留在专家用户这个层面上,这已经成为阻碍语义搜索发展的严峻问题。在另一方面,广大的互联网用户仍然习惯于传统基于关键词的搜索方式,即使搜索引擎提供了简单的布尔表达式查询来增加查询的准确性,然而几乎所有的用户都不用这种最简单的逻辑表达式来进行日常的查询。所以,如果能够将关键词查询这种方式无缝地衔接到语义搜索上,那么对于互联网搜索的广大用户来说,他们就可以凭借习惯的关键词作为手段而达到语义搜索的准确结果。本文提出了一种将用户输入的关键字自动翻译,并且排序成语义搜索查询的方法,并且实现了系统原型SPARK来验证我们的方法。这样通过输入关键词,用户就能获得语义搜索引擎所能接受的形式化语义查询。但由于关键词和语义查询之间的巨大差异,有三个主要的难点需要克服:1)关键词的歧义性:同一个关键词在不同的背景下有不同的含义,如何区分用户想要表达的真正含义是一个重要的问题。2)关系的缺失:在传统的关键词搜索中,词与词之间没有显式的修饰关系,如何区别查询的主要部分和修饰部分的关系非常困难。3)翻译结果的多样性:歧义性和属性缺失会造成大量可能的查询,如何挑选出符合用户信息需求的查询就显得非常重要。为了解决以上的问题,我们针对性提出了将关键词翻译成为系统所能接受的语义查询的三阶段步骤:通过多种单词-本体资源匹配方法解决了多义问题,通过有效的查询图生成算法较好地解决了关系缺失的问题,最后通过查询排序的方法对生成的语义查询进行评价,向用户反馈相关的语义搜索查询。在SPARK的实现中,用户可以输入任意表达信息需求的关键词,系统根据算法最后生成一系列符合用户信息需求并且可以被语义搜索接受的SPARQL查询语句反馈给用户,或用户可以直接将这些SPARQL查询提交给执行引擎以获得语义搜索的结果。实验表明,本文提出的方法在转化查询的质量上达到了比较好的效果,也证明通过关键字可以进行有效的语义搜索,这点对于语义搜索的推广和用户的普是有跨时代意义的。此外,我们还分析了目前方法的不足之处,并对进一步的研究进行了讨论。
其他文献
发展是人类历史上经久不衰、令全世界普遍关注的主题。时代不同,对发展的定义和衡量指标也不同,最具代表性的是在20世纪90年代联合国开发计划署(UNDP)的专家提出的人类发展。
中央集权制与中央高度集权制的区别金相文薄贵利长期以来,许多人把中央集权制与中央高度集权制混为一谈。这是一种误解。事实上,中央集权制与中央高度集权制是性质完全不同的两
<正>练习课在小学数学教学中,所占比例相当的大,约占整个教学课时的数40%~60%,其地位也不容忽视.由此可见,如何提高练习课的课堂教学效率,全面提高教学质量的重要途径之一.我
邓小平北方谈话指的是邓小平1978年结束了朝鲜之行后,于9月13—20日在东北三省和夫津、唐山等北方城市发表的一系列谈话的总称。在新中国历史上,作为客观存在的事实,北方谈话
本文立足于国内外消费伦理观念体系发展的进程和现状,从国内外消费伦理研究进程和现状梳理入手,提出消费的道德追问和伦理维度,消费伦理在社会发展过程中显性作用,提出适应我
农村集体建设用地市场化最大的障碍就是土地所有者的各种权利束不完整引致的。这种残缺的产权主要体现在占有权虚无、使用权受限、收益权分割、处分权虚置等方面;农村集体建设
<正>比格犬(Beagle)又称米格鲁猎犬,原产英国,是国际通用的纯品种犬之一,大量实验证实该犬对实验的均一性、重复性和可比性都良好,在国内外已被广泛应用于疾病的研究。目前,
会议
近年来,有许多文献对二度价格歧视理论进行了比较深入的研究。目前,关于二度价格歧视理论的研究主要分为两个方面:一是在既知的需求条件下研究厂商如何对需求区间进行分段以
2018年全国旅游工作会议提出优质旅游概念后,引起各界广泛关注。优质旅游是发展理念和发展模式的新突破,是从粗放型发展方式向集约型发展方式的转变,它不等同于优质服务,而是
目前生态市场还不够成熟,生态价格的测定标准和方法不统一,森林生态价值的实现主要依据政府补贴价,其价格形式比较单一,且现行的补贴价格远远低于其生态价格。如果按照全成本