【摘 要】
:
图数据依靠其独特的格式,能够将数据间复杂的结构关联可视化。随着大数据时代的到来,图网络数据已经遍布生物学、化学、社会学等多个领域,常见的有物流交通网络、社会交际网络、化学分子网络等。图卷积网络模型是一种有效的半监督学习图模型,是用于在给定图上进行结构等特征提取的方法。为了解决图卷积网络在训练过程中存在的可伸缩性、准确性、计算的复杂性等方面问题,图采样方法抽取有代表性的节点,以便进行小批量节点的训练
论文部分内容阅读
图数据依靠其独特的格式,能够将数据间复杂的结构关联可视化。随着大数据时代的到来,图网络数据已经遍布生物学、化学、社会学等多个领域,常见的有物流交通网络、社会交际网络、化学分子网络等。图卷积网络模型是一种有效的半监督学习图模型,是用于在给定图上进行结构等特征提取的方法。为了解决图卷积网络在训练过程中存在的可伸缩性、准确性、计算的复杂性等方面问题,图采样方法抽取有代表性的节点,以便进行小批量节点的训练,从而使图卷积网络能应用于大型图数据中。近几年来,关于图采样方法的研究很多,其中逐点采样法在每个节点处独立地采样固定数量的邻居节点,按层递归聚合采样节点的信息,却导致采样节点数随层数增加而指数增长,最终产生邻域爆炸。逐层采样法每层采样固定数量的节点,采样节点同层之间共享;子图采样通过随机游走等方式从原始图中采样子图。上述两种方法虽解决了邻域爆炸问题,但并未充分利用图的全局信息和局部结构信息,使得采到的点不与图的结构强相关。本文通过分析不同卷积层之间节点的邻居关系,着重考虑了图的结构特点,联合蒙特卡洛采样、热核特征和波核特征建立了图节点的重要性采样算法,提升了图卷积网络训练的效率。本文提出了一种基于热核特征的图节点重要性采样算法,首先通过热扩散方程的解引入离散热核特征,选择非独立地按层采样,将图卷积网络模型中的上层节点作为热源。然后通过上层节点一阶邻居的热量分布建立节点采样的概率分布,其中根层节点的选择偏好度数高的节点。最后对于每一个给定的节点v,本文利用蒙特卡洛方法,用均值近似计算图卷积网络中节点v的嵌入函数值,通过所构建的概率分布进行重要性采样。为了解决热核特征受到低频信息的限制而无法区别不同节点局部结构差异的问题,本文又提出了一种基于波核特征的图节点重要性采样算法,首先分析了量子力学中波函数的统计意义,随后建立了图数据的波核特征。最后本文在多个数据集上做了数值实验,并与已有算法进行对比分析,得出本文算法在采样准确性、稳定性、耗时等方面均表现良好的结论。
其他文献
本文研究Korteweg-de Vries方程基于广义数值流通量的超弱间断有限元和直接间断有限元方法。Korteweg-de Vries方程是一种刻画浅水波表面运动的偏微分方程,其解通常存在大梯度孤子波的现象,因此求解该方程具有一定的难度。间断有限元方法是一种用来求解一阶方程的具有任意高精度特性的有限元方法。局部间断有限元、超弱间断有限元和直接间断有限元方法作为间断有限元方法的推广,可以用来求解高
局部间断有限元(LDG)是求解高阶方程的具有高阶精度的数值方法。目前针对KdV方程和BBM方程的数值解研究较多,但对具有混合空间时间导数的BBM-KdV方程的数值解研究则相对较少。本文对非线性和线性的BBM-KdV方程的局部间断有限元方法进行了研究,包括LDG格式的构造,稳定性分析,误差估计以及数值实验。将LDG方法应用到具有混合空间时间导数的BBM-KdV方程的数值求解是本文的一个亮点。在第二章
目标检测是计算机视觉领域最具研究价值的方向之一,得益于计算机硬件水平的发展以及互联网信息时代图像数据的喷井式爆发,近年来目标检测算法性能已经取得了长足的进步,然而小目标的检测仍然是一个难点,其中一个重要的原因在于小目标包含像素少,分辨率低。本文在经典两阶段目标检测算法Faster RCNN的基础上提出了基于超分辨率重建的目标检测算法Faster R-CNN+双次SR与基于分类网络的目标检测框架Cl
具有奇异性的偏微分方程,如:Helmholtz方程、Boltzmann方程、Maxwell方程、Schr?dinger方程、Navier-Stokes方程等,广泛存在于非光滑区域的弹性力学、考虑点源的传热学、非光滑控制论、非光滑优化等方向。然而,当问题出现奇性时,解在奇点附近将有剧烈的变化,可能会导致传统的有赖于解的光滑度假设的高阶方法失效。因此,为了取得可以与光滑问题相媲美的精度与效率,有必要对
经典数理统计常利用假设检验的方法推断总体的分布,为权衡推断过程中产生的两类错误概率,内曼-皮尔逊引理利用似然比统计量给出了最优势检验函数。而量子统计中的假设检验基于量子测量的结果判断系统所处的状态,对应于经典情形,量子内曼-皮尔逊引理为二元假设的最优测量提供了构造方法。由于制备和测量量子态需要大量的实验工作,因此研究假设检验问题具有重要的意义。本文基于量子内曼-皮尔逊检验,对第一类成功概率进行分析
由于水下成像环境的复杂,并且受浮沙、浮游生物和光照的影响而动态变化,水下图像往往具有偏色、对比度低、细节信息模糊的特点,原始的水下视频图像很难达到视觉质量的要求。近年来,为了提高水下图像的视觉质量,水下图像增强受到了广泛的关注和深入地研究。随着深度学习在计算机视觉领域的巨大成功,基于深度学习的水下图像增强算法逐渐成为了水下图像领域的研究热点。然而,同时获得大量退化和清晰的配对水下图像是几乎不可能的
随着自动驾驶、机器翻译的快速发展和办公无纸化的潮流到来,文本识别成为了人们生活、学习和工作的得力助手。文本识别可以将纸质文档中的文字提取出来保存为电子文档,也可以将商品包装上的外语提取出来进行翻译,但是在某些工作中,仍然使用传统的人工方法录入和核对文本信息,比如检查出入境验讫章上的日期和城市。此外,文本识别对文字的清晰程度比较敏感,往往需要先对图片进行预处理。因此,本文主要研究基于扩散方程图像增强
结合参数模型的易解释性与非参模型的灵活性,本篇工作改进了部分线性可加空间自回归模型(PLASRM),我们不仅考虑了因变量的空间效应,也考虑了线性影响变量的空间效应。PLASRM是部分线性可加模型与杜宾空间自回归模型的结合,具有强大的灵活性。鉴于B样条具有良好的估计性质且相比较于其他非参函数拟合方法更为简便,本文采用B样条方法对非参函数进行逼近,将模型在一定程度上转化为线性模型。对于模型的内生性问题
21世纪以来,同盟在大国竞争中依然扮演着重要角色。非对称同盟成为国际关系中诸多双边或多边同盟关系的常态,以美国为中心的庞大的非对称同盟体系,成为当下最引人注目的同盟现象。本文在对传统同盟理论、非对称同盟理论及冷战后同盟理论的新进展总结梳理的基础上,总结归纳出冷战后非对称同盟的新特点。菲美同盟是典型的非对称同盟,这些特点在杜特尔特主政时期的菲美同盟中表现得十分突出。依据非主导国对主导国的依附和自主性
随机延迟微分方程在通信、生态、力学等方面都有非常重要的应用。由于这类方程的精确解难以得到,因此,用数值方法来近似方程的精确解在实际生产中得到普遍应用。稳定性是数值分析中的重要内容,研究方程数值解和精确解稳定性的关系在理论和实际中都有重要的意义。本文主要针对随机延迟微分方程,研究其数值解能否保持精确解的阶矩指数稳定性的问题。该问题可通过构造一类随机脉冲延迟微分方程,将随机延迟微分方程的精确解和数值解