【摘 要】
:
图作为一种表示事物之间关系的常用抽象数据结构被大量应用在现实的许多场景中。例如,论文引用网络、社会关系网络、交通网络等。由于人工神经网络对于传统机器学习任务的革新以及其取到的良好的效果。目前,将人工神经网络应用到图结构的任务之上已经成为一种趋势。该种任务需要使用到结构信息,因此我们有必要对图的结构进行深入的研究,这将有助于我们理解图的结构和提升与之相关的下游任务的效果。例如,节点分类、节点推荐、链
【基金项目】
:
国家自然科学基金面上项目(61976071); 黑龙江联合基金项目(LH2020F012);
论文部分内容阅读
图作为一种表示事物之间关系的常用抽象数据结构被大量应用在现实的许多场景中。例如,论文引用网络、社会关系网络、交通网络等。由于人工神经网络对于传统机器学习任务的革新以及其取到的良好的效果。目前,将人工神经网络应用到图结构的任务之上已经成为一种趋势。该种任务需要使用到结构信息,因此我们有必要对图的结构进行深入的研究,这将有助于我们理解图的结构和提升与之相关的下游任务的效果。例如,节点分类、节点推荐、链接预测等等。本论文关心的核心问题是如何在低维向量空间中尽可能多地保留图中节点的结构信息。以往的节点嵌入算法往往关注于利用低维向量的每一个维度来表示节点周围邻域的几何特征。例如,在链路上的节点、星形网络的中心、两个簇之间的桥梁等等。这些结构的标记工作往往需要借助领域专家的帮助以及大量的手工标记工作。因此,其难以向大图拓展。受到前人关于热传导工作的启发,本研究中将波函数引入到了图节点结构特征嵌入的任务之中。提出了一种基于量子力学的图节点结构嵌入方法。本研究将一个图作为一个孤立的量子空间,通过定义图上的函数以及将图的拉普拉斯矩阵作为哈密尔顿能量运算符来得到图上单量子的孤立空间中在某一位置检测到量子的概率。再利用积分,得到某一位置观测到量子的平均概率。通过设置合理的特征能量分布来得到一个可以在不同能量尺度对系统进行观察的模型。然而,由于积分的使用,本研究通过实验发现,该模型嵌入的结果缺少节点的邻域信息,整个嵌入向量的分辨度较差。为了更为精确地描述节点的结构信息,本文考虑将节点周围邻域节点的信息加入到目标节点的嵌入向量中。最终通过邻域节点到目标节点的最短路径划分出目标节点的多层次邻域,然后利用概率的可积性来达到一个空间上的多尺度嵌入效果。本文基于波函数提出了一种新的图节点结构嵌入方法,经过实验证明,该方法可以达到结构相似的节点在嵌入空间中相距较近,结构不相似的节点在嵌入空间中相距较远的效果。文中各个不同的实验表明,本文提出的算法,嵌入向量的质量相比于其他算法有一个较大的提升,可以为下游的任务提供帮助。
其他文献
兴隆台潜山勘探的起步较早,但中生界勘探进展仍十分缓慢,主要是因为中生界地层厚度大,勘探井数量少,储层岩性复杂,横向变化快,非均质性强,常规流程及反演方法难以达到理想的预测效果。针对这些问题,本论文首先从研究区储层岩性特征入手,利用不同岩性在测井上的响应不同,建立岩性测井识别图版,对研究区储层进行识别,然后针对兴隆台中生界储层特征,优选出储层优势岩性,最后采用波形指示反演的方法进行储层预测,在预测结
文安斜坡作为冀中凹陷重要的油气探区,其石油来源问题一直是勘探关注的重点。本研究通过文安斜坡有效烃灶分布、油源特征、输导通道刻画及油藏分布等方面研究,分析了文安斜坡沙河街组油气运移路径及其对油气分布的控制作用。研究表明:文安斜坡洼槽共发育三套有效烃源岩,即未熟-低熟的沙一下亚段(Es1下)、沙三段(Es3)烃源岩和成熟的沙四段(Es4)烃源岩。文安斜坡原油可分为三类:A类和B类油为分布在斜坡北部和中
<正>党的二十大报告提出,坚持以人民为中心发展教育,加快建设高质量教育体系,发展素质教育,促进教育公平。长期以来,深圳市民办幼儿园是深圳学前教育的重要力量,在学前教育普及普惠发展背景下,民办园向公办园转型、新型公办园的建设以及高标准的学前教育成了深圳学前教育发展的必然之路。为此,深圳开展“依托模式”增加公办园数量,即一所公办总园下依托几家分园,所托的分园有两种类型,一是新建立的公办园,二是民办园转
随着互联网技术和生物医学领域的不断发展,能够在线获取的生物医学文献数量增长迅速,这些文献中往往蕴含着大量有价值的医疗保健信息和生物医学数据,是该领域研究工作中十分宝贵的资源。作为信息抽取的核心子任务,关系抽取可以检测出实体之间在无结构化或非结构化的自然文本中所表达的语义关系,对于推动生物医学的发展具有重要意义。生物医学领域的有监督关系抽取通常受限于人工标注数据集的规模和成本,难以满足深度学习方法对
生物信息技术的飞速发展使得各类生命活动被不断深入研究,新一代高通量测序为科研人员提供了海量的遗传数据,这对医疗、农业、环境保护等领域的发展产生了巨大的推动作用。当前新冠肺炎(COVID-19)在全球肆虐,严重威胁着世界人民的生命健康,在这样的情况下,如何利用已有的大量数据来预防和治理各类相关的问题已经成为了当下讨论的主流,越来越多研究人员的加入使得一些原有问题得到了很好地解决,但是仍旧存在诸多难题
方正断陷位于松辽盆地东侧依舒地堑北段,隶属于依舒地堑的次级构造单元。研究区重点含油层系为白垩系地层,目前钻井证实研究区构造较为复杂,失利井较多,因此开展白垩系油气成藏条件研究尤为重要。通过对研究区成藏条件的分析,可为大庆油田增储上产提供理论支撑。本论文结合沉积地质学、石油地质学和构造地质学,综合运用岩心、测井、录井和生产动态等资料,对研究区的构造演化特征、沉积储层特征和油气成藏条件进行分析,最终圈
<正> 案一、肺痈 陈××,男,57岁,住院号30863,因发热,胸痛、咳咯脓血性腥臭痰,于76年7月22日由外科病房转入。 患者6月25日,因“胆囊炎”收住院,行胆囊切除术后发热咳嗽,X线胸片显示:“右侧中肺门区可见一片状密度增高阴影,边缘模糊不清,其中可见透朋亮区并液平面,其壁较厚”经中医会诊改服中药。 初诊:形体消瘦,发热咳嗽,汗出而喘,短气但坐,咯脓血痰,味腥量多,胸痛烦闷,
随着信息技术的发展,医学健康数据呈指数级爆炸式增长,数据变得越发庞大冗杂,医疗健康术语或概念实体之间的关联分析利用面临巨大挑战。针对此方面问题,本文在建立医疗健康知识图谱的基础上,利用特征学习的方法实现基于特征空间的医疗健康知识图谱检索和医疗健康文献询证检索。本文的主要工作有:(1)研究大规模医疗健康领域知识图谱的构建方法。从数据采集处理、知识抽取以及实体消歧等方面开展深入研究并构建医疗健康知识图