基于词嵌入的本体对齐研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:sky011
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
计算机网络的迅速发展导致数据产生爆炸式的增长,知识图谱为这些网络上异构、海量、动态数据的表示、组织、管理和利用提供了一种高效的方式,提高了网络的智能化水平。本体是从客观世界中抽象出来的概念模型,包含概念以及概念之间的关系,是对知识的抽象和对某个领域之中的概念及其之间关系的形式化表达。构建本体的目的是描述领域知识,领域中存在的并行本体开发现象提出了本体对齐的需求。本体对齐以本体作为输入,以对齐结果作为输出,确定不同本体中语义相关的实体之间的对应关系,是语义网互操作性的关键促成因素。随着表示学习技术在自然语言处理领域的发展与成熟,专家学者开始尝试将其应用于本体对齐问题。与原有的特征提取方法相比,表示学习技术存在一定优势,使用大量相关语料预训练得到的词嵌入能够表示单词内在的语义信息,识别字面表示不同而语义相同的单词。但是由于词嵌入的生成依靠单词的上下文,这导致词嵌入存在无法准确区分语义相似性与描述相关性。为了解决这一问题,本文结合本体对齐的具体任务,使用SCBOW模型和Knowledge distillation模型对词嵌入进行改进,利用改进后的词嵌入获取实体嵌入,从而计算两个实体的相似度,获取候选实体对。考虑到使用词嵌入完成本体对齐任务只利用了实体的语义信息,而本体是由实体按层级关系组织成的网络,包含丰富的结构信息。本文利用MTrans E模型对两个本体进行嵌入和本体空间映射,得到实体的结构嵌入,进一步使用本体的结构嵌入计算实体对的相似度,获取最终对齐结果。实验表明改进词嵌入和加入实体的结构嵌入,均在一定程度上提高了概念实体相似度计算的正确率。
其他文献
随着深度学习技术的发展,研究者们利用神经网络对文本进行情感分析,取得了非常好的结果。但随后研究陷入了瓶颈,以往的技术无法处理蕴含复杂情感的文本,尤其当文本中包含几种
QCD预言退禁闭相变在高温或高密情况下发生。中子星内部为机高密环境,可能有夸克物质存在。这给传统中子星模型及相关天体物理带来挑战,脉冲星的中心天体本质需要深入探讨。
随着国际投资活动的频繁推进,投资相关争议也越来越尖锐,其中公平公正待遇条款因为语义抽象,所以在适用中存在诸多分歧,也因此越来越受到学界的关注。对中国既已签署的148个
地理位置是人类行为活动的重要基础之一,而室内又是人类每天活动时间最长的场所。因此,将室内位置与用户数据或用户感兴趣的信息结合起来是值得深入研究的一个重要课题。室内
近年来无线通信技术发展迅速,已经渗透入日常生活的方方面面。在未来万物互联时代,海量的无线通信设备(如无线传感器、可穿戴设备、智能手机等)同时工作在网络的边缘,其普遍
手势作为一种人与人之间简便、直观的交互形式,随着人工智能和计算机视觉的迅速发展,对手势的识别也从过去的利用各种外界辅助设备到基于计算机视觉的研究阶段。而增强现实作
随着无线通信技术近年来迅速发展,通信服务的质量和数据传输速度不断地得到提升。安全问题依旧是无线通信理论的一个重要问题。物理层安全根据无线信道的特性,以信息论的角度
大跨度桥梁通常使用缆索承重体系,包括各种吊(系)杆拱桥、斜拉桥和悬索桥等。国内外近年来有多座桥梁的拉索(或缆索)因为耐久性不足而更换,经济损失巨大。而大跨拉吊索桥换索
写作作为一门综合性语言技能,反映了学习者综合的认知水平和思维能力。在写作学习中,学习者掌握相关的语篇知识以及衔接手段是学习者的基本要求之一。语篇衔接手段的运用,有
单向度教育是教育现代性危机的深层体现,面对这种使人的批判性、否定性与创造性逐渐消退的单向度化危机,我们有必要深入探讨如何将这种发展危机转化为发展的可能。因此,本研