基于网络角色的知识图谱实体嵌入方法的研究与实现

来源 :东南大学 | 被引量 : 0次 | 上传用户:lixiaobo59178
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
知识图谱是一种描述物理世界中的实体概念及其相互关系的图结构知识库。知识图谱实体嵌入方法则旨在表征实体特征,得到实体低维稠密的向量表示,使得对知识图谱的分析推至数值计算层面,生成的实体嵌入可广泛应用于机器学习相关的下游任务中。现有知识表示学习方法多是针对知识图谱的三元组结构进行实体和关系建模,忽略了实体之间的复杂关系,如实体的多步路径和多阶邻域信息等。此外,基于图结构的表示学习方法认为图中相近的实体共享相似的特征,生成的嵌入表示在向量空间中更加相近,相距较远的实体对应的嵌入将更加远离。此类方法忽略远距离的实体的结构相似性,也未能考虑实体属性相似性对实体的影响。这种不同层面的实体相似性可用不同的网络角色来体现。由相同角色的实体构成的实体路径可用来更为全面地表征实体在图结构中的特征。本研究主要研究工作如下:1.提出知识图谱中实体的网络角色发现方法。首次将网络角色概念用于统一化表征实体的多种语义相似性,实体的不同相似性将对应不同的角色发现方法。本研究共提出了知识图谱中实体的四种网络角色:同质性角色、基于属性相似性的角色、基于结构相似性的角色和基于中心性相似性的角色。2.提出基于网络角色的实体路径建模方法。采用随机游走模型生成基于不同网络角色的实体路径,并分别使用Skip-Gram和CBOW-attention神经网络模型对实体路径进行无监督特征提取生成实体嵌入。3.将基于网络角色的实体嵌入方法应用于知识图谱的实体画像工作。实体画像的核心工作是将实体的嵌入表示用于实体相似度计算,进一步去度量实体标签的区分性。并对实体画像结果进行可视化,使得用户能从大量冗余的实体描述信息中获取到具有区分性的实体结构化标签信息。本研究在开放域知识图谱DBpedia及其它领域相关知识图谱等数据集上对生成的实体嵌入进行了实体相似度、实体分类和链接预测等下游任务的评估。大规模知识图谱生成的实体嵌入表示可离线保存或作为背景知识链接到其他数据集,具有一定的工程应用价值。
其他文献
大量研究表明适当进行身体锻炼有助于保持身体健康、预防多种慢性疾病、促进身体代谢和生长发育。然而高强度的工作学习压力使得人们往往无暇顾及自己的运动量,看不到明确量化的运动又一定程度上导致人们对运动的积极性不高。因此全天候实时记录识别人体动作具有重要的研究价值和意义。能够利用随时随地产生的无标注数据的无监督学习算法与能够随时随地记录人体运动数据的可穿戴式传感器系统之间的相互结合,在这一领域有着广阔的应
强子的电磁形状因子是强子物理中非常重要的非微扰物理量,它反映了强子的内部结构,所以精确测量强子电磁形状因子几十年来一直是非常热门的课题。实验上,可以通过测量ep散射,e+e→pp,eπ弹性散射和e+e→π+π-等过程的截面来抽取质子和π介子的电磁形状因子。2000年JLab的实验表明采用Rosenbluth方法和极化转移法给出的质子电磁形状因子比值有不可忽略的差异,2003年Blunden等人的研
目的综合评价合并角膜散光的长眼轴患者在白内障超声乳化联合Toric人工晶体(intraocular lens,IOL)植入术后中远期旋转稳定性和主客观视觉质量。为临床上长眼轴合并角膜散光的白内障患者IOL的选择提供理论依据。方法采用回顾性队列研究。选择2016年4月至2018年12月至东部战区总医院接受白内障超声乳化联合Toric IOL植入术的患者,术前规则角膜散光≥0.75D,共55例69眼,
随着移动通信产业的迅速发展和第五代移动通信系统(5G)的逐步应用,移动用户和移动设备的需求不断增长,大规模分布式移动网络作为5G中的关键网络架构,具有更高的宏分集增益和更小的传输距离。其中大规模分布式天线系统(DAS)通过部署更多的远端天线单元(RRU),增加系统容量和频谱效率(SE)。大规模分布式天线系统在带来系统性能提升的同时,还会产生很大的回程消耗和干扰管理问题。本文为了让系统性能便于分析,
图形用户界面随着计算机、通信等技术的发展在各个产业界以及人们的生活中已经被广泛应用,并且帮助人们提升工作效率和改善生活质量,图形用户界面的设计和评价也随之不断被重视。图形用户界面的设计评价要素包括颜色、内容、结构以及布局等,其中元素的布局在设计评价中作用尤为重要。同时,信息技术、人工智能技术的迅猛发展,对界面设计评价提出了更高的要求,也提供了更多潜在的应用方法。因此在本研究中,以界面布局评价为研究
儿童肾病综合征(Nephrotic syndrome,NS)是一种临床常见的儿童肾脏疾病,主要表现为以大量蛋白尿、低白蛋白血症、高脂血症和水肿为主的一组临床症候群,其年发病率为1.15~16.9/100,000,目前有关该病流行病学调查方面的资料国内报道十分有限。NS尚无特异血清学诊断标志物,组织活检是NS诊断和病理分型的“金标准”,但组织活检具有创伤性,且不适用于肾脏状况连续监测。微小核糖核酸(
对话行为是一种浅层范畴的用户意图,表达出的是用户最直接的行为。对话行为分类作为自然语言理解的基本任务,在对话系统中发挥着重要的作用,其目的是识别出对话内容的对话行为,并辅助做出对话决策。随着人工智能的发展,对话系统慢慢地融入人们的生活,提供智能、便捷的服务。为了改善用户的体验感受、贴合用户的意愿,系统需要提供更加精准的语义理解,因此对话行为分类的研究具有重要的意义和实用价值。据调研发现,基于规则的
色彩是界面应用中最有效的信息编码方式,通过色彩层级映射信息层级的方式能够帮助用户快速识别信息,提高认知效率。本文重点研究色彩应用过程中色彩-面积特征整合对视觉感知的影响,探究面积改变视觉显著性的界限,目的在于克服认知容量7±2的限制,保障用户高效识别目标信息,为扩大色彩编码范围和发挥色彩的引导性作用提供支持。本文以色彩显著性层级理论为基础,对色彩的功能应用进行研究,并从三个方面展开:第一、采用调整
目前CMF的设计主要是依靠设计师的经验,所以设计师的认知偏差造成的决策失误是产品失败的重要原因。在商业社会中对于材料的研究应该着重于对作为消费者的“人”的研究,而这部分的研究相较材料物理化学性能的研究则少之又少,且缺乏系统性的探索。本文将以这个为切入点,基于材料的CMF感知评价数据,找到材料CMF物理属性与人的心理属性之间的映射关系,为设计师提供CMF设计辅助。本课题首先通过M-F-C的顺序对金属
学位