面向实体知识的表示学习研究

来源 :华中师范大学 | 被引量 : 0次 | 上传用户:xinxinxiangrong1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着大数据爆炸式的增长,数据越来越庞大,想要从互联网上获得精确信息越来越难。近年来,随着深度学习的兴起,以深度学习为代表的表示学习技术受到了广泛的关注。表示学习也被应用到了大规模知识图谱的构建。词语的表示虽然有多种,如何更高效表示,成为了重要而基础的工作。目前一种表示学习(分布式表示)方法受到广泛关注。当前词是利用上下文信息映射到一个低维的空间中的向量,与传统的向量表示有所不同,这种词向量被映射成低维、实值、稠密的向量。低维有效的降低了计算的复杂度;实值化有利于消除词语之间语义鸿沟;稠密使得每一维度的数值都参与了计算。表示学习是一种很高效的表示方法。在知识库的表示中,知识一般是以三元组(头实体,关系,尾实体)的方式来表示。借助于词向量表示方法,将知识三元组表示为(头实体向量h,关系向量r,尾实体向量t)。由于词向量具有平移不变性的特点,经过一系列的线性变换,在实体知识三元组中,使得h+r=t等式成立。将头实体h加上某种关系r得到某个尾实体t。根据这个特点,有学者就提出了翻译模型,认为关系r可以看成是头实体h到尾实体t的翻译。由于翻译模型过于简单,对于复杂关系的表示并不理想,关系与实体混在同的空间里计算。通过一系列的矩阵映射,本文提出了一个新模型,翻译矩阵映射模型(TMM)。将头实体与尾实体分别映射到同一关系语义空间中,得到新的头、尾实体和关系表示。在复杂关系表示中,特别是歧义、噪声问题,翻译矩阵映射模型并不能有效捕捉这些信息。因此,本文提出了高斯消歧模型TMMG,将关系与实体看成是一个高斯分布,有效的消除了歧义关系。在链接预测评测实验中,实验结果显示新模型有较好的表现。实体知识图谱的表示中,推理分为规则的推理和基于图的推理。基于规则的推理需要依赖背景知识、经验等将大量规则加入到推理中,优点是推理精确度高,缺点是通用性差,需要人工制定规则。基于图的推理可以通过算法自动发现推理关系,优点是自动识别、通用性好,缺点是精确度不是很高。在知识图谱中,结点表示实体知识,边表示对应的关系。对较为重要的结点,给予加权,对于两个结点比较稀疏的关系路径可以次要考虑,基于这种思想,本文提出了加权图推理模型PIW,最后实验验证PIW模型在检索的精确度上有较大提升。
其他文献
<正>有国内糖业人士判断,只有少数企业可以真正进入年产百万吨行列,更多的企业将在竞争中由并购实施者变成被并购对象,行业格局最终会被改写。近两年,糖料主产区异常激烈的原
目的:探讨妇科门诊尖锐湿疣患者的心理特点以及相应的护理措施。方法:根据患者心理压力不同,实施有针对性的心理护理措施。结果:本组65例患者,心理压力主要原因是:担心治疗效果、
组成及功用组成主要由贮气筒、充放气控制阀、气压表、充放气电源开关、前后轮选择开关、充放气选择开关、气体管路、手控阀等部件组成。充放气电源开关是轮胎中央充放气系统
目的 探讨自体造血干细胞移植治疗在慢性关节周围损伤性疾病的临床疗效,评价其临床应用价值.方法 选取本院接收治疗的慢性关节周围损伤性疾病6例,收集自体造血干细胞,采用关
现今,我国对电力的需求量逐渐增大,电力调度的运行是整个电力生产单位的生命线.电力调度工作肩负着经济发展、国家民生的重任,是我国保持电力安全运行的重要工作.但是电力调
目的:探讨老年糖尿病患者的对策。总结护理经验,用于指导临床护理工作。方法:根据糖尿病患者的病情,有针对性提出应对糖尿病的手段,采取血糖监测、药物应用、饮食和心理护理及
本文经由古壁画、古墓砖、古瓷器以及实地考察、拍摄等多种途径收集中国古代竹马舞的图片,通过对这些图片的考源、分析,结合历史文献的记载,从图像学的视角考察中国古代竹马
由于华润电力(常熟)有限公司3号机组6kV配电间分体空调室外机所处环境温度过高,导致其空调室外机故障频繁,不能正常工作的具体情况,通过对现场考察及以往相关数据的分析,利用精
本文是"陕西省大件运输管理及桥梁安全评估关键技术研究"科研项目成果系列论文之一,主要解决大件运输车辆通行桥梁安全评估方法问题。文中给出适用于大件运输车辆通行桥梁安