论文部分内容阅读
随着计算机技术和网络技术的飞速发展,网络信息量呈带宽的指数级速度增长。人们希望在这个信息量爆炸的社会中,可以通过网络获得所需信息。在这样的背景下,关系抽取技术诞生并发展起来。通常来讲,用户通过关系抽取来实现信息抽取,尽管传统的关系抽取可以得到很多实体之间的显式关系,但很多时候不能满足用户的查询请求。为了获取更多的隐含关系信息,为了给用户提供满意的服务,本文从本体入手,利用其在语义信息方面的表达能力,提出了基于本体的关系抽取与检索,使抽取的关系更全面,在充分“理解”用户需求的同时,为用户提供智能的检索服务,让用户更满意。 本文从对传统关系抽取的研究中发现,大量的隐含关系抽取都无法实现,这些关系都隐藏在字面信息以外。传统关系抽取是通过模式匹配或机器学习等方法直接得到关系库,完成关系抽取工作,也就是说传统方法都停留在语法层面,即只能“读出”字面意思,没有很好的从语义层面发掘文字背后的深层关系信息,这就遗漏了大量有价值的信息。针对这个问题,本文提出了基于本体的关系抽取。为了使本体更具有关系抽耿的针对性,本文首先建立了关系本体,它不仅具有丰富的语义信息,更是以关系为研究中心,与本文实现了无缝结合,再利用关系本体推理构建性能优良的扩展关系库。另外,为了使关系可以更好的被用户所使用,在关系检索方面,本文首先提出了一种有效的语义相似度量方式SSR,并使用SSR对用户查询进行了基于本体的实体扩展,提高检索的查准率和查全率。排序方面,传统方法只考虑了客观方面因素,无法令用户真正满意,本文提出了基于用户需求的语义优先排序SPR方法,不仅考虑关系及相关网页本身,还融入了与用户需求的语义匹配度,使检索可以充分理解用户需求,从而提高用户体验质量,让用户满意。 实验结果显示,基于本体的关系抽取,达到了比较满意的效果;关系的检索与排序由于添加了语义信息,优于传统方法,很好的满足了用户的需求。