基于多源信息组合的知识表示学习

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:tianstone
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
知识图谱将现有的知识构建成大型的网络系统,是人类过往经验与智慧的结晶,如今在人工智能的各种任务中发挥着愈来愈重要的作用。知识表示学习的目的是将知识图谱中的实体和关系投影到低维的向量空间,使知识图谱能够更加便捷地应用于各种下游任务。知识图谱中,实体的文本描述信息、实体的层次类型信息和图的拓扑结构信息中隐藏着丰富的内容,是对结构化三元组的重要补充。将这些多源信息进行组合,能够帮助提高知识图谱各种任务的效果。为了充分利用这些信息,首先通过一维卷积神经网络嵌入文本描述信息,然后根据实体的层次类型信息构建投影矩阵,将三元组中的实体向量和实体的描述向量映射到特定的关系空间中来约束实体的语义信息,再基于图注意力机制融合图的拓扑结构信息,计算不同邻接点对实体的影响。在图注意力层中,计算了实体间的多跳关系来帮助改善数据稀疏的问题。此外,模型训练时引入了生成对抗网络来生成高质量的负样本三元组,以充分发挥模型的表示能力。最后,通过二维卷积神经网络来捕获不同维度间的全局信息,进一步提高模型的性能。知识图谱上的链接预测和三元组分类实验结果表明,基于多源信息组合的知识表示学习模型能够充分利用三元组以外的多源异质信息,因而相比于其它基线模型,取得了更好的实验结果。
其他文献
随着生活节奏的加快与社会压力的增大,人们因饮食不规律导致患胃肠道疾病的现象愈加严重。近年来,无线胶囊内镜技术已成为检查患者胃肠道的首要选择。然而,一次无线胶囊内镜检查将产生约6万张图像,带给医生后续筛查工作沉重的负担,如何快速有效地从海量图像中识别检测出病变已成为亟待解决的重要问题。神经网络在处理图像问题上有着得天独厚的优势,基于神经网络的医学影像分析为解决这一问题带来新的契机。无线胶囊内镜图像与
随着互联网逐步深入到人们的生活,网络安全问题也影响到社会生活的方方面面,其中以木马和僵尸网络所造成的危害最大。为了躲避网络边界的检测,这类恶意软件通常使用HTTP协议作为应用层协议,把自己的流量隐藏在大量HTTP背景流量当中。传统基于流量模式匹配的检测方法,在面对这类经过伪装的恶意流量时往往无能为力,研究者们开始转向使用机器学习的方法来实施恶意流量检测。而这些方法,往往针对单个HTTP请求数据流进
近年来,随着智能手机和平板电脑广泛普及,互联网社交媒体的用户数量迅速增长,与此同时产生了海量的社交媒体数据。在这样一个信息爆炸的大数据时代,如何挖掘出海量数据背后的价值成为了众多研究者的研究方向。相较于其他数据挖掘方法而言,机器学习无疑是当前应用最广泛且最成熟的。研究人员将社交媒体和机器学习相结合,在分析公众舆论,灾害治理,市场营销等方面已经取得很大的成效。然而不可否认的是,在机器学习技术给我们带
在现实世界中,图像数据包含现实对象的海量信息,是对客观对象的描述或客观的映射。为计算机能够更好的理解现实世界,发展出来多种计算机技术,基于深度学习的语义分割方法能够较好地提取图像高层语义信息,更好地应对自然场景。深度学习语义分割算法中的特征提取部分十分重要。模型越深特征提取能力就越强,但是所得到的特征越抽象。以Deeplab语义分割框架作为基础,提出优化方法,通过对比实验结果说明优化效果的有效性。
近年来随着深度学习技术的快速发展与卷积神经网络在计算机视觉研究工作中的广泛应用,图像分析与理解领域的研究工作取得了瞩目的成绩。作为图像分析与理解领域的重要分支,光学字符识别(Optical Character Recognition,OCR)技术和方法逐渐成熟,在生活中得到广泛应用,将OCR技术用于文档识别与场景文字识别的需求与日俱增,具有极大的使用价值和应用前景。票据作为人们生活中常接触到的一种
随着互联网的快速发展以及企业运维项目管理的要求越来越高,传统的开发部署模式存在许多不足之处。比如资源利用率低、难以迁移、强依赖于硬件、无法持续集成、部署困难、配置环境复杂等。这种传统开发模式已经不能满足用户以及企业需求,大量企业开始寻求新的开发部署模式。为了解决上述问题,本文设计并实现了一个持续集成与部署系统,采用一种新的运营管理模式来替代传统的部署模式。首先对系统进行需求分析,将系统分为五大功能
由于机器学习技术带来的产品功能与性能上的优势,在不同的行业背景下应用前景愈发广阔。在机器学习工程中,训练使用的数据质量极大影响了被训练模型的效果。为方便算法模型获取特征明显的训练数据,需要对原始数据进行标注处理以便于算法模型发现其中的模式与规律。汽车资讯标注系统是在此背景下为处理与汽车资讯相关图像、语音与文本数据,通过全人工标注或半自动标注方式,将汽车资讯原始数据转化为可供算法模型训练的数据集。根
红外成像系统,无论在民用还是军事领域都得到了广泛的应用。而要对红外成像系统,以及其上搭载的其他功能进行测试,往往需要使用红外仿真技术,其逼真度直接影响测试的可靠性。所以在三维场景仿真中常使用光线追踪作为渲染框架。路径追踪是光线追踪框架的一种实现方式,使用了蒙特卡洛方法,随机跟踪多条光线,随后根据这些光线的贡献计算该点的颜色值。利用蒙特卡洛方法的无偏性和一致性,生成照片级真实的图像。大多数成熟的渲染
论文针对大型构件高铁白车身腻子自动化打磨过程中,需要同时满足大尺度、高精度、稠密点云以及高效率的测量需求,在多目视觉线结构光大尺度高精度测量技术的基础上,提出基于辅助相机标定的多目视觉线结构光大尺度高精度测量方法,降低对标定工具的要求,简化标定流程,同时采用全局优化算法对测量系统整体优化,减小点云数据拼接误差,进一步提高测量系统的精度,实现高铁车身表面三维形貌的全局精确测量,为高铁白车身自动化生产
信息时代下,网络数据获得爆发式增长,其带来更好的服务、更便捷的体验的同时,也带来了信息过载问题。就电影网站而言,电影数据资源的不断增多和观影人数的不断扩大,导致观影者无法在短时间内挑选到其喜爱的电影。如何能为用户精准推荐成了电影系统研究和设计的热点问题。本文即从此出发,提出了基于矩阵完备性的推荐算法来设计电影系统,并对这一设想进行了实现。具体研究内容如下:(1)设计算法来缓解协同过滤所存在的稀疏性