基于本体的实体关系抽取与检索

来源 :东北大学 | 被引量 : 2次 | 上传用户：qncy1239o

【摘要】

：

随着计算机技术和网络技术的飞速发展，网络信息量呈带宽的指数级速度增长。人们希望在这个信息量爆炸的社会中，可以通过网络获得所需信息。在这样的背景下，关系抽取技术诞生并发

【作者】

：

白洁

【机构】

：

东北大学

【出处】

：

东北大学

【发表日期】

：

2012年01期

【关键词】

：

关系抽取检索技术语义分析相似性度量

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着计算机技术和网络技术的飞速发展，网络信息量呈带宽的指数级速度增长。人们希望在这个信息量爆炸的社会中，可以通过网络获得所需信息。在这样的背景下，关系抽取技术诞生并发展起来。通常来讲，用户通过关系抽取来实现信息抽取，尽管传统的关系抽取可以得到很多实体之间的显式关系，但很多时候不能满足用户的查询请求。为了获取更多的隐含关系信息，为了给用户提供满意的服务，本文从本体入手，利用其在语义信息方面的表达能力，提出了基于本体的关系抽取与检索，使抽取的关系更全面，在充分“理解”用户需求的同时，为用户提供智能的检索服务，让用户更满意。　　本文从对传统关系抽取的研究中发现，大量的隐含关系抽取都无法实现，这些关系都隐藏在字面信息以外。传统关系抽取是通过模式匹配或机器学习等方法直接得到关系库，完成关系抽取工作，也就是说传统方法都停留在语法层面，即只能“读出”字面意思，没有很好的从语义层面发掘文字背后的深层关系信息，这就遗漏了大量有价值的信息。针对这个问题，本文提出了基于本体的关系抽取。为了使本体更具有关系抽耿的针对性，本文首先建立了关系本体，它不仅具有丰富的语义信息，更是以关系为研究中心，与本文实现了无缝结合，再利用关系本体推理构建性能优良的扩展关系库。另外，为了使关系可以更好的被用户所使用，在关系检索方面，本文首先提出了一种有效的语义相似度量方式SSR，并使用SSR对用户查询进行了基于本体的实体扩展，提高检索的查准率和查全率。排序方面，传统方法只考虑了客观方面因素，无法令用户真正满意，本文提出了基于用户需求的语义优先排序SPR方法，不仅考虑关系及相关网页本身，还融入了与用户需求的语义匹配度，使检索可以充分理解用户需求，从而提高用户体验质量，让用户满意。　　实验结果显示，基于本体的关系抽取，达到了比较满意的效果;关系的检索与排序由于添加了语义信息，优于传统方法，很好的满足了用户的需求。

其他文献

中职《低压电器控制》课程教学辅助软件的开发与研究

《低压电器控制》课程是电气工程及自动化类专业的一门核心专业课。目前在许多中职学校由于教学条件和教学环境的制约，《低压电器控制》教学仍然停留在课堂理论分析上，实习实训

学位

中等职业学校《低压电器控制》课程教学辅助系统软件开发

基于子空间的人脸图像处理与识别方法研究

本文对人脸识别系统中的主要环节的技术作了研究，主要包括图像的预处理、人脸的检测与定位、图像归一化处理、特征提取、人脸识别算法。在图像预处理中包括对原始图像的亮度、

学位

人脸识别人脸检测投影算子核函数子空间分类器

互联网AS级宏观拓扑中心化研究及演化分析

随着互联网的迅速发展,网络已成为人类社会中不可或缺的一部分,当由于网络中心节点发生故障或瘫痪造成整个网络出现大规模“问题”时,互联网本身的“脆弱性”也逐渐显露出来

学位

互联网的复杂性AS级拓扑中心化节点删除中心化攻击

基于知识点的智能化远程教学环境

计算机网络以及卫星数字通讯技术为现代远程教育提供了支撑,使它具备了时空自由、资源共享、系统开放、便于协作等优点.该文对一个基于知识点的,由课件学习系统、作业系统和

学位

知识点CSCWXMLIMS数据挖掘概化

分布对象技术在塑料生产远程监控系统中的应用研究

在该课题研制现代自动化管材挤出生产线的设计过程中,在比较了多种控制方案后,设计了一种由现场实时控制与监视网络、本地辅助监控与工艺数据存取服务网络、远程监控诊断子网

学位

分布对象技术生产监控视频捕捉CORBA服务OPC总线OPC技术规范CORBA技术塑料工业

可视电话---H.263极低码率视频编码技术研究

随着数字通信和多媒体技术的发展，极低码率视频编码技术的研究变得尤为重要。本文主要对基于H．263标准的低码率视频压缩编码方法进行了研究，提出一种既有宏观预分配又有微观分割

学位

H.263建议低码率视频编码可视电话运动估计图像滤波缓存器控制分形编码小波变换三维离散余弦变换快速搜索矢量量化预测编码信源编码

飞行器气动外形图形网格服务设计

本文介绍了飞行器气动外形图形网格服务,它实际上是一个使用网格技术开发的一个分布式可视化系统，实现了网格计算技术和分布式可视化技术的有效结合，可以有效帮助众多图形处理

学位

图形网格服务计算流体力学后处理分布式可视化VTK开放网格服务架构

RLS-BP神经网络及其应用研究

本文首先讨论了递推最小二乘反向传播神经网络(即RLS-BP网络)的基本原理，然后通过实验验证了此网络现相对于传统BP网络在网络性能方面的改善。最后，根据目前国内航空作战指挥系

学位

递推最小二乘反向传播目标识别相控阵列

面向中小企业数据库应用方案的设计与实现

随着开放源代码运动的盛行以及国家对于软件版权问题的重视,我国的中小企业临两种选择:继续采用原有的基于微软Windows平台的企业管理信息系统(包括:ERP等)并为此付出昂贵的

学位

进程共享内存客户/服务器FreeBSDMySQL

面向对象的软件测试研究

该文首先介绍了面向对象方法引入的特性如封装、继承、多态等给测试面向对象软件带来的困难;然后按照软件测试步骤详细阐述了面向对象软件的单元测试、集成测试和回归测试技

学位

面向对象软件测试类控制流图数据流分析操作调用序列测试级别类之间依赖分析回归测试选择类影响闭包

基于本体的实体关系抽取与检索

其他学术论文