【摘 要】
:
随着智能信息服务的迅猛发展,知识图谱逐渐成为互联网数据知识服务的主要形式,在智能领域得到广泛的应用和发展。由于目前大部分开放知识图谱中,存在大量实体之间隐含的关系尚未发掘,不完整的问题限制了诸多下游应用的效能发挥,知识图谱补全成为亟待研究的重要问题。知识图谱推理以事实预测和关系推理为任务,是知识图谱补全最主要的方法,也是支撑知识图谱下游应用的关键技术。早期的推理主要依靠规则和逻辑,而在深度学习技术
论文部分内容阅读
随着智能信息服务的迅猛发展,知识图谱逐渐成为互联网数据知识服务的主要形式,在智能领域得到广泛的应用和发展。由于目前大部分开放知识图谱中,存在大量实体之间隐含的关系尚未发掘,不完整的问题限制了诸多下游应用的效能发挥,知识图谱补全成为亟待研究的重要问题。知识图谱推理以事实预测和关系推理为任务,是知识图谱补全最主要的方法,也是支撑知识图谱下游应用的关键技术。早期的推理主要依靠规则和逻辑,而在深度学习技术推动下,基于知识图谱表示学习的推理方法,凭借在计算和存储效率上的优势,已成为知识图谱推理研究的主要方法。本论文针对现有方法在结构信息建模、辅助信息利用上的不足,研究如何有效挖掘利用文本描述和邻域结构两类信息,提出了邻域信息分层感知和文本语义增强的嵌入和推理模型,有效提高了知识图谱推理的效能。本论文的主要研究工作如下:(1)提出了基于邻域信息分层感知的表示学习及推理模型。以充分挖掘知识图谱结构中蕴含的关联语义信息为目标,针对传统图注意力网络对于关系的语义挖掘利用上的不足,提出一种层次图注意力网络编码节点邻域信息的模型,该模型基于Encoder-Decoder框架,按关系和实体两个层次区分注意力权重,实现更细粒度的节点嵌入表示,有效提高了推理预测的准确度和可解释性。(2)提出了基于文本描述语义增强的表示学习及推理模型。针对直接使用预训练语言模型进行推理预测存在的计算开销大、三元组结构特征学习不足的问题,提出一种将预训练语言模型同传统嵌入算法相结合的框架,该框架运用预训练语言模型编码实体和关系的文本输入,并通过KGE模型分阶段完成微调和训练,实验验证了该框架的适用性和有效性。(3)提出了基于结构与文本多信息表示学习的联合推理模型。提出将邻域信息与文本描述两个编码模块结合的推理模型,在学习三元组结构信息的同时,以节点邻域信息和文本描述信息共同作为补充进行知识表示学习,实现基于结构和文本的联合推理。
其他文献
新冠肺炎疫情影响全球已达两年之久,对社会和人们生活造成了颠覆性的影响,涉及到了整个社会的方方面面。语言作为人们赖以交流思想的主要媒介也难免因此而产生变化。大量新闻媒体一直以来都保持着对疫情的高度关注,也因此产生了大量可供语言研究者分析的新闻语料。这些语料相比社交平台语料而言,语言更加规范且能从多角度描述疫情和社会生活的关系,是很好的分析素材。本研究从认知语言学的视角出发,试图应用框架语义学和构式语
深度学习在计算机视觉领域的表现十分亮眼,基于深度学习的方法能够处理很多图像相关的问题,比如图像生成、图像修复等。生成式对抗网络作为深度学习中的一种重要方法,能够生成高质量的图像,用于扩充数据集、图像分类等。虽然生成式对抗网络的表现十分优秀,但是其存在着许多问题,如训练不稳定、模式崩溃等,需要进一步的改进优化。首先,本文提出了一种基于生成式对抗网络的两阶段图像生成方法,提升生成式对抗网络的图像生成能
文章以宁波舟山港为例,结合专家访谈结果,梳理出港口发展的影响因素。通过DEMATEL方法分析各影响因素相互间的作用程度,并以此为依据确定各影响因素间的因果关系和每个因素在系统中的重要程度;采用ISM方法,对各影响因素进行层级划分,厘清各要素间的逻辑结构关系,再运用MICMAC方法将所有影响因素进行归类。通过研究发现:资源整合能力、安全运输保障、港腹互动、专业人才、港内外资聚集度,处于解释结构模型的
联邦学习是一种分布式机器学习框架,它允许具有计算能力的节点在不移动本地数据的情况下进行全局模型(也称之为联邦模型)的联合训练,其能有效保护数据隐私并减少计算负担,同时能取得与集中式训练的模型相当的性能。然而,联邦学习能取得上述效果多基于独立同分布假设,即各个节点上存储的数据是独立同分布的(Independent and Identically Distributed,IID),并且最近的研究发现,
<正>近年来,教堂在认真贯彻落实党和国家宗教方针政策,积极发扬爱国爱教精神,狠抓和谐寺观教堂创建工作等方面都取得了积极的成效。重庆市云阳县天主教圣安多尼堂原名云阳县天主堂,始建于清光绪三年(1877),距今已有140年历史。在三峡库区移民迁建过程中,圣安多尼堂顾全大局,克服重重困
属性网络广泛分布于真实世界中,包括引用网络、社交网络和交通网络等。属性网络中蕴藏着丰富的信息,包括节点之间的复杂关系、节点携带的属性和属性网络全局的性质。由于属性网络的复杂性和多样性,直接分析属性网络不仅需要丰富的专家知识,也需要大量的尝试。属性网络表征旨在将属性网络中的节点映射到低维表征,同时保留节点自身丰富的语义信息以及节点之间的近似性。由于真实世界中的属性网络通常包含很多节点,人工标注这些节
以西藏自治区为例,利用倾斜摄影测量和三维建模技术获取了区域内高精度实景三维模型,基于数据类型对数据库进行概念设计,基于空间数据库环境下的Geodatabase模型对三维实景时空数据库进行逻辑设计,并在此基础上开发了三维实景时空数据库管理平台,提供数据管理、数据展示、三维分析和交互浏览服务等功能,实现了对三维实景数据的管理和综合展示,使信息与数据的展示更简洁、更全面。
互联网前沿技术的发展,推进了各项改革措施持续的落地。在新时期建设中,我国与各个国家之间的贸易活动来往频繁,投资作为贸易活动过程中重要的组成部分,同时也是在金融经济环境下采取的重要手段之一。与此同时,在金融投资中也存在诸多问题,尤其加上金融形势不确定因素较多,增加了金融投资中风险的发生概率。因此,需要根据金融投资风险的特点,选择正确的应对方案及预防措施,推进金融投资工作可以更加科学地落实,进而逐步提
目的 分析按病种分值付费下子宫壁内平滑肌瘤手术患者住院费用构成及影响因素,为合理控制住院费用提供依据。方法 收集广州市某医院2019年1月1日-2020年12月31日实行按病种分值付费结算子宫壁内平滑肌瘤手术患者302例,利用单因素分析和多重线性回归方法对住院费用影响因素进行分析。结果 子宫壁内平滑肌瘤患者平均住院费用为27 558.5元,最小值为17 398.6元,最大值为40 236.0元;手
工作记忆写作模型认为,作为常见的语言产出活动,写作不是由简单的线性词汇选择构成,而是由一系列子过程组成的一项复杂的认知活动。在这些子过程同时竞争工作记忆中的注意力资源时,所需资源很可能会超出工作记忆的容量极限。此时,写作者往往会采取停顿的策略以释放一部分的注意力资源。因此,停顿常常被视为了解写作认知过程的可视化窗口。同时,得益于键盘日志程序的出现,计算机写作过程中的每一次停顿行为都能被记录下来以作