【摘 要】
:
现今互联网中的数据大多呈现出规模庞大、结构松散的特点,使得人们从中获取有用的知识信息变得异常困难。知识图谱补全(KGC)技术是扩充知识图谱规模的关键技术之一,目前主要方法是基于已有的结构化信息以及无监督的学习方式对知识图谱进行补全。本文以知识图谱为研究对象,提出语义关联信息抽取模型,并在该模型基础之上衍生出两种开放式的动态知识图谱补全模型,工作主要包括以下三部分:(1)针对现有的知识图谱补全模型大
论文部分内容阅读
现今互联网中的数据大多呈现出规模庞大、结构松散的特点,使得人们从中获取有用的知识信息变得异常困难。知识图谱补全(KGC)技术是扩充知识图谱规模的关键技术之一,目前主要方法是基于已有的结构化信息以及无监督的学习方式对知识图谱进行补全。本文以知识图谱为研究对象,提出语义关联信息抽取模型,并在该模型基础之上衍生出两种开放式的动态知识图谱补全模型,工作主要包括以下三部分:(1)针对现有的知识图谱补全模型大多只考虑将关系作为两实体间的语义关联信息,但很少考虑到实体关系间的存在的语义关联信息,本文提出基于深度记忆网络和多头注意力机制的语义关联信息抽取模型(SAIE-DMMA),该模型首先设计矩阵映射的方法将实体相关信息投影到对应的关系空间中,并考虑将实体与关系间的关联紧密程度作为区分不同的实体在相同的关系下空间映射的依据,然后基于深度记忆网络并设计关联配对的计算方式提取出实体关系间的语义关联信息,最后设计双通道的全卷积神经网络对文本特征进行阶梯式的语义融合,并在每一级的特征融合中设计基于关系的多头注意力机制动态适应关系的多语义选择问题。该模型在一定程度上强化了知识图谱中的内部语义关联性,进一步的提升了知识图谱补全任务的准确率和综合性能。(2)针对现有知识图谱补全模型利用已有实体来补全知识图谱中的三元组,但当实体是从外界引入时,补全模型的准确率较低。针对该问题,本文提出基于深度RNN编码和双层注意力机制的动态知识图谱补全模型(DKGC-DRDA)。该模型设计将通过(1)提取出的实体与关系之间的语义关联信息与本地知识图谱进行关联与重构,并传递给深度Bi-GRU编码层以及N-Attention层,Bi-GRU编码层负责建立知识图谱中每个三元组内的局部结构化信息与外界文本信息之间的关联性,N-Attention层则通过设计权重分配层中的权重模块来强化模型对实体关系词和潜在关联信息之间的注意力,并通过实体和关系的邻居子图信息来增强全局结构化信息与文本信息之间的关联性。该模型通过建立外界与本地知识图谱之间的关联性,进而对已有知识图谱进行补全工作,这对于开放式的知识图谱补全任务有着重要的研究意义。(3)针对现有知识图谱补全模型在小规模知识图谱上补全效果不佳的问题,本文提出半监督的基于图卷积神经网络和路径置信度的动态知识图谱补全模型(SDKGC-GPC),该模型设计将实体与关系的邻居子图信息对其进行重构。针对实体邻居的编码模块,首先设计将实体邻居中的实体描述文本经过(1)中的SST和TSF模块来提取出实体邻居子图中潜在的语义特征信息,并结合邻居子图的结构化信息共同传递给E-GCN编码层以及信息增益层,信息增益层包括计算实体邻居的子图信息和外界文本信息间依赖关系的Attention层,以及基于置信度评判机制对实体邻居子图中的关系路径进行可靠性评估的路径权重层。针对关系邻居编码模块,利用Bi-GRU网络和Attention机制提取出关系邻居子图的结构化信息。最后利用Attention机制对重构后的三元组进行关联性学习。此外,半监督模块设计将部分知识种子引入到SDKGC-GPC以提供引导性学习,实现了半监督式的知识表示学习,并在小规模知识图谱的补全任务中起到十分重要的作用。
其他文献
驾驶行为分析和风险预测对于道路交通安全、智慧城市、无人驾驶和金融保险等领域具有重大意义。随着汽车保有量的逐年增长,道路环境日渐复杂,交通安全问题越发严峻。为了保障道路交通中的生命财产安全,分析驾驶行为和预测风险已刻不容缓。然而,由于各种条件限制,现有的驾驶风险分析工作面临着若干挑战。首先,目前的一些驾驶行为分析和风险预测工作通常以粗粒度的方式来评价驾驶风险,缺少对驾驶行为进行细致描述并且无法发掘潜
危险驾驶行为不仅会造成了严重的交通事故,而且会导致重大的生命财产损失。对驾驶员危险特征进行提取有利于道路安全。很多保险公司无法识别在交通事故中产生了巨额赔付的驾驶员中的高风险客户,因此这是导致车辆保险行业利润减少的最重要的因素之一。所以对驾驶员进行危险特征提取有助于保险公司识别危险驾驶员,从而调整定价策略以提高盈利。因此,驾驶员危险特征提取在道路安全以及车辆保险计价均扮演重要的角色。传统的驾驶员危
资源枯竭和环境污染是当今世界上的两项巨大挑战。建筑作为人类主要的居住环境,是能源消耗和污染排放的主要贡献者之一,建筑业必须成为节能减排的重点,同时应承担为人类提供舒适健康的使用空间以及良好生态效益的任务。中国是目前世界上最大的排放国和最大的能源消费国,为解决这两个问题,促进绿色建筑的发展势在必行。绿色建筑可以在建筑的使用周期内尽可能最大化的实现节约资源、保护环境的目标,并且为人们提供健康舒适的使用
近年来,随着时代的发展,各地高校数量的增多,可持续校园的理念被运用于校园规划与建设中。步行作为最“绿色”的出行方式,得到校园可持续规划的重视。在新校园的交通系统规划设计中,逐渐体现出“人车分离”和“步行者优先”的设计原则。但在多数已建成的大学校园中,由于在规划设计之初对步行系统的重视不够,校内的步行空间存在着一些亟待解决的问题。针对这些问题,需要通过有针对性的优化设计,创造更加便捷、舒适的步行空间
移动边缘计算(Mobile Edge Computing,MEC)是一种新兴的计算范式,它在智能物流、城市智能交通和智能安防等方面都有着广泛的应用前景。在这些场景中,卷积神经网络(Convolutional Neural Network,CNN)是一种常用的技术。它在图像识别、物体检测等领域有着出色的表现。在过去,卷积神经网络的训练和推理都在云端完成。随着片上系统(System-on-Chip,S
随着世界各国军事现代化建设步伐加快,军队信息化程度越来越高,信息化战争已是大势所趋。为了适应快速变化的信息化战场局势,由本地指挥中心和各种战术终端组成的战术边缘网络应运而生。凭借自身高机动性以及强大的战场态势感知能力,战术边缘网络在信息化战争中扮演着越来越重要的角色。然而,在敌我双方对抗的环境下,敌方会通过各种手段攻击我方战术网络,特别是对于靠近战场前线的战术边缘网络,受敌方攻击和篡改的可能性更大
第五代移动通信技术(5th generation wireless systems,5G)在信道容量、时延、吞吐量等方面有明显的改善,其数据传输速率可达4G的数百倍。随着5G技术的飞速发展,5G的应用将渗透到各行各业,促进全球数字化转型。目前5G频谱在移动终端的商用主要集中在sub-6 GHz频段,毫米波频段的应用尚未成熟。由于5G高传输速率的要求以及手机终端尺寸的限制,5G终端天线必须要具备宽带
现如今,电子设备各式各样,有很多的因素决定着电子设备的性能。这其中,时钟源是一个比较关键的因素。时钟源就好像电子设备的心脏,电子设备要想正常运行,时钟源不可或缺。随着通信设备的普及,通信测量仪器的需求量也日益增多,现代通信设备测量仪器中,需要精准的时钟源,来保证测量数据的精确性。所以,精准的时钟源有着广阔的应用前景。但是,在使用时钟源的过程中,其输出频率会随着温度的变化而恶化。所以,对时钟源进行校
复杂系统在自然社会中无处不在,而网络科学是描述、分析、理解、设计复杂系统最常用的理论框架。网络科学的研究内容十分广泛且丰富,学习节点属性对网络连边进行预测是当下热门的研究内容之一,其中链路预测和推荐算法的研究都是根据节点相似性对网络未来可能产生的连边进行预测。链接预测是网络科学中重要的研究方向之一,具有巨大的研究和实际应用价值。近年来,网络表示学习的方法通过学习节点特征,使得链路预测的研究取得了重
近年来,推荐系统发展迅速,在诸如淘宝、京东、亚马逊等各大电商平台上随处可见,它在一定程度上给商家带来了可观的经济收益,同时也帮助用户更好地选择商品。传统推荐算法主要研究用户与物品之间的关系,然后给用户推荐最符合他们兴趣爱好的物品集。但在现实生活中,用户的历史行为隐含着某些辅助信息,例如相邻物品间的关系等信息。比如一个Java开发工程师,随着工作时间的增加,其阅读的书籍逐渐由入门类书籍过渡到更加专业