知识表示学习中考虑基数约束的筛选方法

来源 :吉林大学 | 被引量 : 0次 | 上传用户:blackboy1221
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
知识图谱(Knowledge graphs,简称KG)是一种表达实体之间关系的语义网络,用节点表示实体,方向表示实体之间的关系,常常表示为三元组的形式,即(头实体,关系,尾实体),记为(?,,)。近年来,知识图谱已经被广泛应用于人工智能(AI)的各个领域。但是,由于现实中的知识是随着时间不断扩大的,知识图谱的补全也是一个动态的过程。所以说,知识图谱缺失大量的三元组,通常是不完备的。知识表示学习方法,将知识图谱中的实体和关系嵌入到稠密低维实值向量中,可以有效地预测知识图谱中缺失的三元组。知识图谱中通常只存储正三元组,然而,负三元组在知识表示学习中同样至关重要。通常情况下,采用随机负采样的方法生成负三元组,但生成的负三元组大多数为简单的三元组,一段时间后,对知识表示学习方法的训练贡献变小,甚至几乎没有贡献。为了缓解这一问题,有研究者提出了基于对抗性学习的负三元组筛选方法——KBGAN筛选方法,可以自动生成高质量的负三元组。但是,该方法存在严重的“假负例”的问题,所谓“假负例”,是指通过筛选方法生成的负三元组实际上是知识图谱已经存储的正三元组。“假负例”的过度训练,会影响训练得到的知识表示学习模型。同时,KBGAN筛选方法没有针对三元组的关系类型进行区分,不同关系的三元组,生成“假负例”的比例是不同的。针对上述问题和现象,本文为知识表示学习的负三元组筛选方法提出了一种针对不同关系类型采取不同的筛选策略的方法——考虑基数约束的筛选方法ECCS。具体工作如下:首先,本文提出一个判定三元组类型的方法,对知识图谱训练数据集中的三元组进行关系类型的判定和分类,并将类型信息标记在三元组数据中;随后,本文提出了两种不同的考虑基数约束的筛选的方法,ECCS-T方法和ECCS-S方法。ECCS-T方法的基本思想是通过自动调节概率分布,使得最可能的“假负例”的概率值降低,从而降低“假负例”被筛选出来的可能性;ECCS-S方法的基本思想是增加一个筛选器,通过筛选器,剔除掉最可能的“假负例”,以缓解筛选出的负三元组为“假负例”的问题。在FB15k237、WN18、WN18RR三个数据集上分别将本文提出的知识表示学习中考虑基数约束的筛选方法——ECCS方法和KBGAN方法进行对比实验。结果表明,ECCS方法在一定程度上缓解了“假负例”的过度训练问题。
其他文献
不同的语言呈现方式(母语/外语)会影响人们对决策和道德判断任务的认知加工,这一效应被研究者称为外语效应(Foreign Language Effect);随着世界不断一体化的进行,人们需要在
随着纳米材料技术的快速发展,半导体金属碲化物纳米晶因其优异的光电和热电性能,以及广阔的应用前景,近些年来逐渐成为纳米材料领域的研究热点之一。在金属碲化物纳米晶中,碲
近年来,中日两国在各方面交流频繁,语言在其中起到了很重要的桥梁作用,日语作为中国外语学习中的第二大外语,体现出日本社会、文化等对中国人的吸引力,在文化交流过程中,翻译
开关磁阻电机(Switched Reluctance Motor,简称SRM)是一种新型的特种电机,与传统的交流电机相比,开关磁阻电机具有结构简单可靠、效率高、启动转矩大、无击穿风险,造价低廉、调速范围宽、鲁棒性强等优点。正是基于这些特点,开关磁阻电机不仅被广泛使用在纺织、家电等传统工业领域,也受到了新能源汽车等新兴产业的关注。但是由于其自身的双凸极结构,电机在工作中存在着严重的磁路饱和,转矩、电
铁矿石是冶金工业的基础原材料,其酸度测定有助于提高原材料的利用率,与冶金产品的质量。传统分析技术具有分析时间长、样品前处理复杂,迫切需求一种铁矿石酸度快速分析技术。激光诱导击穿光谱(Laser-induced breakdown spectroscopy)是一种基于原子发射光谱的新兴光谱分析技术,具有无需复杂样品前处理、快速分析与远程探测等优势,因而在冶金过程与分析方面具有广阔的应用前景。自由定标
随着科学技术的迅速发展,航空技术也成为了重点发展领域。航空与国防之间已经密切相关。目前飞行速度的急剧增大导致了机体不同部位温度的迅速增大,传统的热防护以及低可探测材料已经受到了越来越多的限制,因此迫切需要开发一种新型材料满足高温应用需求。YSZ(氧化钇稳定氧化锆)材料体系由于具有较为优良的高温电导率,热导率低,在热防护以及隐身涂层材料等方面都具有良好的应用,并且具备多功能涂层体系的应用潜力。当YS
研究背景:骨骼肌挫伤是运动性骨骼肌损伤的常见形式,并且伴随着多种免疫细胞的浸润。巨噬细胞的M1/M2极化对挫伤骨骼肌修复具有重要作用,而Treg细胞可调节巨噬细胞M1/M2极化,
目的:探索脑卒中后肱二头肌痉挛患者的表面肌电信号与肌张力的关系并分析相同肌张力分级下表面肌电信号的影响因素。方法:通过对脑卒中后肱二头肌痉挛患者的改良Ashworth量表
目的:探讨红芪多糖、甘露糖对HepG2 X射线敏感性影响,为临床肝癌辐射增敏治疗提供新思路。方法:给予HepG2X射线分割剂量照射,每次4Gy,累计剂量达到40Gy,建立具有辐射抗拒性能
辽东巡抚自明前期设置以来,经过多年的权力变更发展,至万历年间已经掌握了部分军政大权,与蓟辽总督、辽东总兵共同管理辽东,位高权重。顾养谦作为万历前期一位重要的辽东巡抚