基于强化学习的知识图谱多跳推理方法研究

来源 :吉林大学 | 被引量 : 0次 | 上传用户:huanyu2121
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
知识图谱以结构化的有向图形式来描述真实世界的知识,近年来已被广泛应用于问答、信息检索、推荐系统、机器阅读理解、对话生成等各个领域。然而,常用的大规模知识图谱中存在大量缺失的事实,知识图谱面临的不完整性问题严重阻碍了其在相关下游任务中的应用能力。为了补全知识图谱,基于强化学习的推理方法在知识图谱上进行多跳推理来预测缺失的事实,有着兼具推理的准确性和可解释性的独特优势。然而,当前的基于强化学习的多跳推理方法对于所有到达路径一视同仁,忽视了对不同路径的语义有效性的区分。此外,智能体只有在经过多步探索并成功到达目标实体时才会获得奖励以更新其策略,过于稀疏的奖励信号通常不足以指导复杂的强化学习模型。基于上述问题,本文的主要工作如下:(1)提出了一个基于反事实软奖励的知识图谱多跳推理方法,来解决当前方法中未区分到达路径的语义有效性的问题。该方法首先学习一个关系推理器,根据实体对之间的路径集合推理它们之间的关系,推理基于对二者语义相关性的衡量。然后在强化学习框架中,利用该关系推理器来构建反事实关系推理任务,根据删除某条路径对于关系推理任务的影响来衡量该路径对于推理关系的语义贡献,并进一步量化为该路径的反事实软奖励,以该奖励指导智能体查找更高质量的路径。实验结果表明本文提出的方法能够实现优异的预测性能,并且能进一步增强知识图谱多跳推理方法的可解释性。(2)提出了一个基于好奇心内在奖励的知识图谱多跳推理方法,引入好奇心机制来缓解奖励稀疏问题。在强化学习框架中,基于智能体对其环境知识的预测误差来设计内在奖励信号。智能体根据当前状态和采取的动作预测下一个状态,将预测状态和真实状态之间的误差作为好奇心内在奖励,利用该奖励驱动智能体对环境进行更彻底的探索。为验证模型的有效性,在三个基准数据集上进行了实验,结果表明好奇心内在奖励能够使得智能体寻找到更丰富的路径,提升推理性能。
其他文献
我国煤层“三高一低“的特点制约了煤层气开采,必须对煤层进行人工增透处理来增强煤层的渗透性能。液氮致裂技术作为一种无水力致裂技术,能高效地增强煤层的渗透性能。本文以液氮致裂技术为基础,开展不同循环周期、含水饱和度和初始温度煤样液氮冷浸实验,利用OLS4000激光共聚焦显微镜观测冷浸前后煤样表面裂隙,采用MATLAB图像处理和Fraclab维数计算,利用NM-4B非金属超声检测仪测量冷浸前后声波在煤样
学位
探索是深度强化学习的关键问题之一,尤其是在带有稀疏或欺骗性奖励的艰难探索环境中。通常,基于内在奖励的探索方法可以在艰难探索环境中展现出良好的探索能力。但是,现有的基于内在奖励的探索方法要么只是单一的从全局角度来考虑智能体与环境进行交互过程中的全局动态变化,或者只是单一的从局部角度来关注交互过程中的一些局部环境变化。本文综合了全局的交互动态和局部的环境变化,提出了一种新的基于内在奖励的探索方法,并将
学位
膏体充填开采是一种控制覆岩下沉活动和提高采出率的重要技术,具有绿色环保、充填效果直观等优点,已被广泛应用于中厚及厚煤层的开采中。目前充填开采技术较为成熟,但对充填开采覆岩变形控制机理研究尚不充分,一定程度上限制了该技术的发展。本文以岱庄矿2351膏体充填开采工作面为例,综合运用理论分析、相似材料模拟实验、数值模拟等方法,在测定了粉煤灰地聚合物膏体充填材料基本力学参数和变形特征的基础上,借助三维光学
学位
冲击地压和煤与瓦斯突出复合动力灾害,是深部矿井开采过程中面临的一种由冲击地压和煤与瓦斯突出共同作用的复杂动力现象。与单一的冲击地压或煤与瓦斯突出相比,复合动力灾害的发生机理更加复杂,预测防治难度更大,给煤矿的安全开采带来了更多的技术难题。为此,将依据平顶山矿区复合动力灾害实例的特点,对复合动力灾害发生机理和相互扰动机制进行研究,将复合动力灾害类型进行划分,在此基础上提出了复合动力灾害钻多参量监测方
学位
目的 分析2016-2020年乌鲁木齐市新市区全民健康体检人群血脂异常检出情况及影响因素,运用ARIMA时间序列模型对血脂异常情况进行拟合和预测。方法 获取2016-2020年新市区年龄≥18岁全民健康体检人群血脂异常的相关数据及报表,分析5年间健康体检人群血脂异常的检出情况,以及血脂异常的影响因素,利用时间序列ARIMA模型对2016年1月-2019年12月的血脂异常检出率进行建模,选出最优模型
期刊
电子电气设备在进入市场前必须通过电磁兼容测试要求,本文阐述了电磁兼容的定义以及电磁兼容测试的分类,并根据电磁兼容标准设计实验方法对电能表自动化检定系统关键设备进行电磁兼容测试。通过分析实验结果提出滤波技术、接地技术、布线技术等方案来提升电能表自动化检定系统的电磁兼容性,从而进一步提高其计量的可靠性和安全性。
期刊
在中国共产党第十九次代表大会上,第一次提出了乡村振兴战略,并且强调“三农”问题是民生根本问题。为实现乡村振兴,必须重视耕地保护,因为耕地不仅是粮食生产的载体,也是其根本,只有做好耕地保护工作才可以促进乡村振兴。但是我国耕地资源十分稀缺,同时面临土壤污染等严峻挑战,阻碍农业可持续发展。文章立足湖南地区实际情况,分析了耕地资源合理利用的制约因素,提出了乡村振兴环境下耕地保护的策略。
期刊
随着城市建设不断发展,建筑垃圾产量与日俱增。本文以新和县2018—2020年生活垃圾和建筑垃圾产量为参考,结合新和县实际情况,提出了源头减量控制、建筑垃圾再生利用、推广使用环保建材、完善法律规范和管理制度、借鉴先进技术和模式、引进社会投资等六个方面的建筑垃圾处理优化措施,分析了垃圾处理优化完成后的经济效益和社会效益。
期刊
根据电磁兼容课程实践性强的特点,结合电子科技大学电磁兼容相关课程教学经验,从电磁兼容三大技术——接地、屏蔽和滤波入手,分别设计出相关的教学实验内容。并根据仪器设备条件,开发了实验装置,包括针对接地技术设计的安全接地实验、针对屏蔽技术设计的屏蔽效能测试实验、针对滤波技术设计的传导干扰抑制与滤波实验。在教学中开展的三个实验,促进了电磁兼容相关课程教学和人才培养项目质量的提升。
期刊
聚类是数据挖掘领域的一项经典任务,通过预定义的相似性度量将未标记的输入数据划分成不同聚类。在过去的几年中,人们提出了各种聚类方法来解决现实世界中的问题,如文本聚类和图像聚类。随着图结构数据的出现,如生物网络和社会网络,如何将属性图节点划分为不同聚类引起了广泛关注。与文本和图像数据不同,属性图中的每个节点都有一组属性特征,属性信息表示节点本身的特征值,结构信息则表示节点结构之间的潜在相似性。因此,如
学位