【摘 要】
:
随着计算机技术的发展以及大数据的广泛应用,知识图谱代替关系数据库成为了很多系统的底层基础,例如各大搜索引擎、问答系统等。知识图谱的优越性在于强大的知识表示能力和快速的检索推理能力。随着现实世界的知识不断增长,知识图谱也需要动态的更新,从而引出了知识图谱的补全问题,通过一些表示推理模型来预测缺失的实体或连接。然而,知识图谱当中还存在长尾现象,大部分关系的训练实例较少,传统的关系预测模型面对这一类关系
论文部分内容阅读
随着计算机技术的发展以及大数据的广泛应用,知识图谱代替关系数据库成为了很多系统的底层基础,例如各大搜索引擎、问答系统等。知识图谱的优越性在于强大的知识表示能力和快速的检索推理能力。随着现实世界的知识不断增长,知识图谱也需要动态的更新,从而引出了知识图谱的补全问题,通过一些表示推理模型来预测缺失的实体或连接。然而,知识图谱当中还存在长尾现象,大部分关系的训练实例较少,传统的关系预测模型面对这一类关系并不能得到很好的效果。因此,少样本知识图谱补全问题被提出,目的是在训练样本较少的情况下得到很好的预测效果,当前已有研究者提出了方法,但现存方法都存在对数据的利用不充分,训练效率低,以及对模型的解释性研究不足的问题。为了解决以上问题,本文主要从以下两个方面进行研究:面向少样本关系预测模型的性能方面,从实体邻居结构的聚合方式和相似度计算方式的角度着手,提出基于邻居聚合的少样本关系预测算法;面向模型的解释性不足的问题,从输入数据和模型参数这两个角度出发,分别对所有对比模型和本文提出的模型进行实验分析,实现模型的解释性研究。本文旨在提升知识图谱的少样本关系预测性能的同时,对模型产生结果的影响因素进行分析。主要研究工作总结如下:1.针对现有少样本关系预测方法对数据的处理不够充分,训练效率低的问题,本文提出基于邻居聚合的少样本关系预测方法。具体思路如下:首先,本文对实体的邻居结构进行更细粒度地学习,提取邻居信息中有用的特征,并与原实体结合,使实体表示包含更多有用信息,利于模型推理预测。其次,结合多个相似性度量函数,从多个角度对实体对的相似性进行评估,将多个度量的结果聚合,得到相对准确的相似性分数。最后,为了解决少样本问题,本文利用了元学习机制对模型进行训练,并将训练好的模型在测试数据上进行微调,从而达到更好的预测效果。该方法实现了少样本关系预测模型准确率和效率的提升。2.针对现有研究对少样本关系预测模型的解释性不足的问题,本文设计了一个解释性研究框架。首先,对于通用的输入数据集,从内容和数据量两方面进行实验设计,比较分析数据对模型产生结果的影响。其次,为了进一步对本文提出的模型进行解释性研究,对模型中可以调整的超参数进行实验设计,分析各参数对模型性能的影响。本文提出的解释性研究方法也适用于其他少样本关系预测模型,参数可根据具体的模型调整。本文使用现有研究通用的两个数据集验证本文所提出的算法。实验结果表明,本文设计的基于邻居聚合的少样本关系预测方法不仅能提升少样本关系预测的准确性,而且能减少模型的训练时间。
其他文献
<正>国有企业是国民经济的稳定器、压舱石和重要支柱,既肩负实现国有资产保值增值的发展重任,也承担弘扬主流意识形态的政治职责。进入新时代国有企业意识形态工作面临着更高的使命要求。国有企业需要不断提高新形势下意识形态工作的能力和水平,牢牢掌握意识形态工作领导权、管理权、话语权,有效提高意识形态工作质量,有力维护企业意识形态安全。
从二十世纪九十年代电子商务出现至今,乘着信息技术的东风,电子商务经济规模迅速扩张,以电子商务为典型代表的数字经济正呈现迅猛发展的态势。目前,我国已经成为电子商务的最大市场,数字经济对我国经济发展的推动力不容小觑。在经历20多年自由竞争和野蛮生长之后,2018年制定的《中华人民共和国电子商务法》(以下简称《电子商务法》)对民众普遍关切的电子商务治理中的重大问题给予了法律层面的回应,为规范电子商务领域
随着云计算、物联网技术的持续发展,医院的信息化建设得到有效推进。医疗数据的应用场景日益广泛,一系列风险也逐渐显现,亟需法律进行规制,引导医疗信息化的健康发展。通过考察发现,目前促进医疗数据开放共享已成为热点,而医疗数据共享的法律问题是重中之重,运用文献研究法以及规范研究法对医疗数据共享的法律规制进行深入研究,梳理和分析医疗数据共享法律规制的现状及困境,提出进一步完善建议,全文共包含五章:第一章为引
党的二十大明确提出全面实施乡村振兴战略和建设农业强国。将农业作为强国的抓手,是中国应对国内国际多重风险相互叠加的“压舱石”。为实现农业强国,不仅要继续严守粮食安全底线,而且要在多个维度全面提升农业农村现代化水平。为实现这一目标,普惠金融可以在宏观调控层面、可得性层面、风险控制层面和质量层面发挥应有作用。
近年来,网络信息技术与基因研究技术呈深度结合趋势,在高性能计算机、大数据分析以及云计算的辅助下,人类遗传资源信息的潜在价值被不断挖掘,类似“基因数据库”以及“基因大数据”等平台建设亦在实践中日趋成熟。以人类遗传资源信息利用为目的而展开的人类遗传资源信息跨境流动如火如荼。然而,面对日益频繁的人类遗传资源信息跨境活动,我国当前的法律规范尚不足以应对人类遗传资源信息跨境流动所产生的风险,因而梳理当前相关
公共视频监控作为现代国家广泛使用的社会治理方式,在实践中日益发挥着不可替代的作用。随着一系列政府视频监控项目的推进,当前我国已然成为世界上公共视频监控数量最多的国家。在公共视频监控规模不断增长的同时,其应用技术也得到长足发展。籍由一批智能视频分析技术的支撑,公共视频监控得以智能化、集成化发展,使得公共视频监控进入到了智能时代,完成了由单纯工具意义上的行政辅助手段到具有独立法律效果的程序或机制的跃迁
脑机接口(Brain Computer Interface,BCI)技术不依靠大脑正常的周围神经和肌肉输出路径,而是通过大脑的意识活动来实现外部设备的控制。BCI是人机交互领域一个很有前景的新方向。基于运动想象脑电信号(Motor Imagery Electroencephalogram,MI EEG)的BCI是人机交互领域一个非常重要的分支。本研究以基于MI EEG的BCI技术在智能轮椅上的实际
功率半导体是电力电子技术的核心,在电路中主要起到整流与开关的作用,MOSFET因其高输入阻抗的特点,是常用的功率器件。碳化硅作为宽禁带半导体的代表,具有高击穿电场、高饱和迁移率的特点,适合在高压中高频的领域应用。碳化硅具有多种结构,本文中研究使用的为常见的4H-SiC。本文研究对象为SiC沟槽型MOS(SiC UMOS)。SiC MOFET应用在电路中时开关损耗远大于导通损耗,因此改善开关性能是S
目前,人类活动对环境带来的影响日益凸显,人们发现水体环境的污染会直接对人体健康产生影响。溶液阴极辉光放电技术(Solution Cathode Glow Discharge,SCGD)由于体积小、检测性能好、成本低以及功率低等优点,被广泛应用于环境成分及污染检测。然而在重金属检测方面,由于该技术的放电电流局限于50-70 m A,激发能量不足,因此其检测灵敏度未达到人们的分析需求。对此本文提出以毫
在互联网经济发展前景一片光明的大背景下,数据资源在互联网平台企业竞争中占据了核心地位。作为一种新型资源,数据很难与现有财产客体相匹配,导致运用既有法律无法对数据财产进行充分保护。面对数字经济发展的强烈要求,我国迫切需要探索出一条新的路径来保护互联网平台企业的数据财产。当前数据资源的财产化现实不容置疑,数据资源外延宽泛,数据集合类型多样,这阐明了数据所具有的多元价值。但并非所有数据集合都是数据财产,