基于本体的实体关系抽取与检索

来源 :东北大学 | 被引量 : 2次 | 上传用户:qncy1239o
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机技术和网络技术的飞速发展,网络信息量呈带宽的指数级速度增长。人们希望在这个信息量爆炸的社会中,可以通过网络获得所需信息。在这样的背景下,关系抽取技术诞生并发展起来。通常来讲,用户通过关系抽取来实现信息抽取,尽管传统的关系抽取可以得到很多实体之间的显式关系,但很多时候不能满足用户的查询请求。为了获取更多的隐含关系信息,为了给用户提供满意的服务,本文从本体入手,利用其在语义信息方面的表达能力,提出了基于本体的关系抽取与检索,使抽取的关系更全面,在充分“理解”用户需求的同时,为用户提供智能的检索服务,让用户更满意。  本文从对传统关系抽取的研究中发现,大量的隐含关系抽取都无法实现,这些关系都隐藏在字面信息以外。传统关系抽取是通过模式匹配或机器学习等方法直接得到关系库,完成关系抽取工作,也就是说传统方法都停留在语法层面,即只能“读出”字面意思,没有很好的从语义层面发掘文字背后的深层关系信息,这就遗漏了大量有价值的信息。针对这个问题,本文提出了基于本体的关系抽取。为了使本体更具有关系抽耿的针对性,本文首先建立了关系本体,它不仅具有丰富的语义信息,更是以关系为研究中心,与本文实现了无缝结合,再利用关系本体推理构建性能优良的扩展关系库。另外,为了使关系可以更好的被用户所使用,在关系检索方面,本文首先提出了一种有效的语义相似度量方式SSR,并使用SSR对用户查询进行了基于本体的实体扩展,提高检索的查准率和查全率。排序方面,传统方法只考虑了客观方面因素,无法令用户真正满意,本文提出了基于用户需求的语义优先排序SPR方法,不仅考虑关系及相关网页本身,还融入了与用户需求的语义匹配度,使检索可以充分理解用户需求,从而提高用户体验质量,让用户满意。  实验结果显示,基于本体的关系抽取,达到了比较满意的效果;关系的检索与排序由于添加了语义信息,优于传统方法,很好的满足了用户的需求。
其他文献
《低压电器控制》课程是电气工程及自动化类专业的一门核心专业课。目前在许多中职学校由于教学条件和教学环境的制约,《低压电器控制》教学仍然停留在课堂理论分析上,实习实训
本文对人脸识别系统中的主要环节的技术作了研究,主要包括图像的预处理、人脸的检测与定位、图像归一化处理、特征提取、人脸识别算法。在图像预处理中包括对原始图像的亮度、
随着互联网的迅速发展,网络已成为人类社会中不可或缺的一部分,当由于网络中心节点发生故障或瘫痪造成整个网络出现大规模“问题”时,互联网本身的“脆弱性”也逐渐显露出来
计算机网络以及卫星数字通讯技术为现代远程教育提供了支撑,使它具备了时空自由、资源共享、系统开放、便于协作等优点.该文对一个基于知识点的,由课件学习系统、作业系统和
在该课题研制现代自动化管材挤出生产线的设计过程中,在比较了多种控制方案后,设计了一种由现场实时控制与监视网络、本地辅助监控与工艺数据存取服务网络、远程监控诊断子网
随着数字通信和多媒体技术的发展,极低码率视频编码技术的研究变得尤为重要。本文主要对基于H.263标准的低码率视频压缩编码方法进行了研究,提出一种既有宏观预分配又有微观分割
本文介绍了飞行器气动外形图形网格服务,它实际上是一个使用网格技术开发的一个分布式可视化系统,实现了网格计算技术和分布式可视化技术的有效结合,可以有效帮助众多图形处理
本文首先讨论了递推最小二乘反向传播神经网络(即RLS-BP网络)的基本原理,然后通过实验验证了此网络现相对于传统BP网络在网络性能方面的改善。最后,根据目前国内航空作战指挥系
随着开放源代码运动的盛行以及国家对于软件版权问题的重视,我国的中小企业临两种选择:继续采用原有的基于微软Windows平台的企业管理信息系统(包括:ERP等)并为此付出昂贵的
该文首先介绍了面向对象方法引入的特性如封装、继承、多态等给测试面向对象软件带来的困难;然后按照软件测试步骤详细阐述了面向对象软件的单元测试、集成测试和回归测试技