【摘 要】
:
知识图谱表示学习的目的是将知识图谱中的实体和关系嵌入到连续低维向量空间中,以便在保留知识图谱结构的同时提升下游机器学习任务的性能。但已有的知识表示学习方法大多仅将工作重心放在表示三元组中的结构化信息,而忽略了语义信息对于知识表示学习的重要性。本文将从关系层次结构和实体类型这两类语义信息入手并分别提出对应的知识表示学习方法。关系层次结构,是由关系间的泛化关系subRelation Of构建而成的结构
论文部分内容阅读
知识图谱表示学习的目的是将知识图谱中的实体和关系嵌入到连续低维向量空间中,以便在保留知识图谱结构的同时提升下游机器学习任务的性能。但已有的知识表示学习方法大多仅将工作重心放在表示三元组中的结构化信息,而忽略了语义信息对于知识表示学习的重要性。本文将从关系层次结构和实体类型这两类语义信息入手并分别提出对应的知识表示学习方法。关系层次结构,是由关系间的泛化关系subRelation Of构建而成的结构。本文提出TransRHS模型将这一语义信息高效融入到知识表示学习中。具体来说,TransRHS模型将每个关系表示为位于同一空间的多维向量和与关系一一对应的多维球体,并通过向量和球的相对位置来建模关系层次结构信息。实体类型是能够表明实体所属类别的语义信息。一般地,一个实体有多个类型,但在给定的关系中,头、尾实体的类型是确定的,因此同一个实体在不同的场景下中应该表现出不同的性质。受此启发,本文提出基于实体类型的知识表示学习模型TransET。具体来说,每个实体类型被编码为一个投影矩阵,然后通过矩阵对实体一般表示的映射实现对实体类型信息的建模。本文使用链接预测和三元组分类这两个典型的知识表示学习任务对TransRHS模型和TransET模型进行实验评估,实验结果显示这两个模型的表现要远好于现有知识表示学习方法,其中TransRHS模型在各项指标提升幅度为20%至50%;TransET模型在各项指标提升幅度为5%至40%。以上理论分析和实验结果表明关系层次结构和实体类型这两类语义信息对知识图谱表示学习的各项性能指标有显著的提升,相比于现有知识表示学习方法,以上两个模型能够有效地将这两类语义信息融入到知识表示学习中。
其他文献
信息时代,大数据中含有许多有用的知识,值得人们深入探索、挖掘、研究、分析.随着信息爆炸,数据量暴增,知识图谱在垂直搜索、NLP、社会网络、语义WEB、智能问答、生物信息学医学等领域有着越来越重要且广泛的应用.知识图谱推理算法是根据知识图谱中现存的知识,通过计算推理,得到新的知识的过程,是当前知识图谱的热门课题.对于大量的知识图谱推理问题,现有的张量分解知识图谱算法仅考虑数据的单一特征,对知识图谱的
视频显著性对象检测,旨在找出视频每一帧中吸引人视觉注意的对象。由于其广泛的应用场景,近几年吸引了越来越多的研究兴趣。然而,在当前的视频显著性领域,对“视频显著性对象”的定义一直存在一些争议。在大多数先前的工作中,都使用的是视频对象分割或运动追踪数据集作为标准,直接将单一的前景对象或运动中的对象看作是显著对象,这并不符合我们人眼视觉机制的判断规则。即便后来出现了专门针对于显著性领域的数据集,但它的标
工业物联网通过各类传感器采集工业大数据,并运用大数据智能分析技术优化生产流程。然而,由于具备高潜在价值、强安全需求属性,工业大数据一直存在孤岛问题,难以实现跨领域安全共享。作为新兴技术之一,区块链具备可溯源,防篡改等特性,为工业大数据的安全高效共享提供了良好的前景。但现有对于区块链数据共享的研究,只关注数据共享各方之间数据交换过程的安全性,很少考虑数据共享的效率。因此,如何在使用区块链技术保证数据
近年来,自动驾驶技术的蓬勃发展极大地促进了汽车科技的智能化变革,但高昂的传感器硬件成本严重阻碍了自动驾驶汽车的落地应用。因此如何使用低成本传感器在特定的场景下实现自动驾驶成为了学术界与产业界非常关注的问题。自动驾驶汽车落地应用的基础是精确的感知与定位,因此基于视觉的感知与定位研究对加速自动驾驶汽车低成本落地应用具有重要意义。本文聚焦结构化道路环境,提出一种基于视觉的低成本方案来实现自动驾驶汽车的横
与传统的信息检索系统相比,问答系统提供了一种更为自然的人机交互方式,使得用户能够通过自然语言的方式与机器交流来获取信息。但在很多的实际应用中,机器需要主动地向用户提问,通过理解用户给出的答案来确定用户的真实意图,这个过程被称作反向问答。然而,当前几乎所有的解决方案都通过强制用户点击选项来避免自动的答案理解,这极大地破坏了用户的体验。针对答案理解任务,文章设计了相应的深度学习模型,旨在为用户提供一种
二维人脸识别面对光照、妆容、姿态和遮挡等因素的变化表现较差,在实际应用中对采集的图像要求较高,需要采集到正面清晰图像。而三维人脸数据因为包含二维人脸图像无法提供的深度信息,从而可以有效地应对光线变化与妆容变化等带来的干扰。传统三维人脸识别方法过程复杂,而基于深度学习的三维人脸识别方法,由于缺少足够规模的数据集,目前还无法达到二维人脸识别的研究水平。基于我们的调研,目前相关研究成果中,多是基于已有三
曲率是曲线和曲面重要的几何量,是图像、视觉分析以及计算机图形学的基本几何元素。而欧拉弹性是较早被应用到图像处理领域和计算机视觉中的基于曲率的方法。考虑到曲率在连接缺失的边缘和结构方面出色的能力,我们通过欧拉弹性提出了新的稀疏重建模型。特别地,我们首先将欧拉弹性正则化模型拓展为非局部形式,充分利用图像的模式冗余和结构相似性。由于欧拉弹性项非凸、非平滑、非线性,我们将局部和非局部弹性正则项视为加权总变
信息时代的用户需求趋于个性化、多样化、动态化,如何准确地掌握用户需求并快速地实现其向工程语言的转化成为企业关注的重点问题。如今越来越多的垂直网站、电商网站、产品论坛、社交媒体、问答社区可以为消费者提供广阔的意见表达平台,由此产生的评论内容能够较为真实地反映用户需求与产品缺陷。根据互联网评论数据挖掘用户需求并将其转化为指导产品设计的技术要素,能够帮助企业较好地了解用户体验以及较快地推动产品开发。本文
相比于传统CT,能谱CT利用不同能量光子关于物体衰减的差异性进行成像,能够提高物质分辨能力和准确的材料分离和定量化信息,逐渐成为近年来医学成像领域的研究热点。本文以研究能谱CT成像探测和自动分割技术为目标,对基于边缘入射探测器的成像仿真系统进行级联分析,并提出了改进的CT影像自动分割算法。在CT成像探测方面,本文建立基于边缘入射探测器的CT成像模拟系统,对内部设置相对完善的物理环境的同时利用复合能
光电跟踪系统是一个集光、机、电于一体的远距离光学跟踪成像系统,近年来在海上搜索、靶场测量、国防安全等领域,作为雷达探测的补充装备,在获取目标的精准定位和清晰成像方面上有着不可替代的作用。系统采用闭环控制,将指向器采集到的目标信息经图像处理板处理后传输到显控台,再由显控台根据图像信息生成指令控制指向器,实现对目标的监测跟踪。但由于运动目标会导致系统成像出现不同程度的离焦模糊,影响光电跟踪系统对目标的