动态有向网络中的时序链路预测问题研究

来源 :粘接 | 被引量 : 0次 | 上传用户:pzl_530
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘 要:由于动态向网络具有独特的特征,在对其时序链路预测过程中存在许多问题,为此提出动态有向网络中的时序链路预测问题研究。首先针对动态有向网络特征,采用拓扑结构解决其网络定义问题;利用指数加权滑动平均法对网络时序进行分析,得到T+1时刻预测值,解决时序分析问题;利用聚类算法计算出欧式距离最短的链路路径,解决动态有效网络聚类倾向问题,以此完成动态有向网络中的时序链路预测问题研究。针对上述3个问题提出相对应的解决方法之后,该文中通过仿真实验在真实的动态有向网络中进行了验证,证明通过上述方法解决了相关问题后链路预测效果更佳。
  关键词:动态有向网络;时序链路;拓扑结构;聚类算法
  中图分类号:TP301      文献标识码:A 文章编号:1001-5922(2021)09-0106-04
  Research on the Problem of Time-series Link Prediction in Dynamic Directed Network
  Wang Jin
  (Shaanxi Institute of Technology, Xi an 710300, China)
  Abstract:Due to the unique characteristics of dynamic directed networks, there are many problems in the process of predicting its time-series links. To this end, research on the problem of time-series links in dynamic directed networks is proposed. Firstly, according to the characteristics of the dynamic directed network, the topology is used to solve the network definition problem; the exponentially weighted moving average method is used to analyze the network time series to obtain the time prediction value to solve the time series analysis problem; the clustering algorithm is used to calculate the shortest Euclidean distance chain Road path, to solve the problem of clustering tendency of dynamic and effective networks, in order to complete the research on the problem of time-series link prediction in dynamic directed networks. After the corresponding solutions to the above three problems are proposed, the paper verifies the real dynamic directed network through simulation experiments, and proves that the link prediction effect is better after the above methods are solved.
  Key words:dynamic directed network; sequential link; topology; clustering algorithm
  0 引言
  对于动态有向网络的时序链路预测方法有很多种,比如基于加权算法的时序链路预测方法、基于节点度的时序链路预测方法、基于有向路径的时序链路预测方法等,这些方法有一个共同点是利用动态有向网络的拓扑信息,通过计算动态有向网络结构的相似性,进而预测出网络可能的链路[1]。传统方法虽然在实践中取得了一定的成绩,但是仍然具有一些不足之处[2-5]。传统方法虽然有着良好的实用性,在大多数网络中都能发挥作用,但是缺少针对动态有向网络类型的优化,在对动态有向网络中进行预测时,存在许多问题,因此提出动态有向网络中的时序链路预测问题研究,以提高动态有向网络时序链路预测精度[6-7]。
  1 动态有向网络中的时序链路预测问题介绍
  在动态有向网络中,节点之间存在固有的聚类倾向问题,导致预测过程中,很难将这种聚类倾向加以利用;在对时序链路预测过程中,由于動态有向网络不同于静态网络,需要对网络进行准确定义,关系到时序链路预测结果的精准度;面对时序会发展变化的网络,其时序分析也存在一定难度。针对以上提出的动态有向网络时序链路预测问题,提出应对方法,尽可能减小预测误差,提高预测精度。图1为动态有向网络中的时序链路预测问题及方法。
  通过采用拓扑结构对动态有向网络进行定义;利用指数加权滑动平均法解决时序分析问题;利用聚类算法对动态有向网络中节点的聚类倾向进行充分利用。下文将针对以上3方面时序链路预测问题进行细致说明。
  2 动态有向网络中的时序链路预测问题及对应的 解决方法
  2.1 网络定义问题及其解决方法
  2.1.1 网络定义问题
  此次研究的是动态有向网络的时序链路预测问题,现对于静态网络的链路预测,动态有向网络预测问题更多,首先面临的问题就是网络定义问题。动态有向网络定义与静态网络定义不同,网络是会随着时间的变化而发生变化的动态网络,即在动态网络中顶点的信息与网络中心点的连接结构是随时会发生改变的,显然目前的网络定义不适用于动态网络。   2.1.2 解决方法
  动态网络由顶点集合V和顶点之间的关系E组成。将动态网络映射到图论中,其拓扑结构用公式表示如下所示:
  公式(1)中,V表示飞控顶点集合;E表示非空边集合。动态网络概要图分为2种,一种是有向图,图中的边都是有方向的,且两边顶点处为起点和终点;另一种是无向图,图中的边是没有方向的。由于此次提出的方法是针对有向动态网络的,所以此次对无向网络不做过多的说明,下文中使用到术语“图”均指的是有向图。有向网络定义图如图2所示。
  网络结构中存在5个顶点,如果∈E,那么顶点i和顶点 j是相邻的。顶点i的所有相邻顶点集合记为L(i)。图中顶点i的相邻顶点有顶点g和顶点 j,则它的相邻顶点集合L(i)={g,j}。顶点的degree,指的是网络顶点关联的边的数量,在图中,顶点i是有向网络中的一个顶点,和顶点i关联的边的数量就是顶点i的degree,记为d(i)。图中顶点i的degree为2,记为d(i)=2。对于动态有向网络,图中每个顶点的degree由out degree和in degree组成。顶点i做始点的次数,称为顶点i的out degree,顶点i做终点的次数,称为顶点i的in degree,用数学公式表示如下:
  公式(2)中,表示顶点i做始点的次数;din(i)表示顶点做終点的次数。图中顶点i到顶点 j的路径是一个时序顶点序列,路径的长度等于路径上的边的数量,第一个顶点与最后一个顶点相同的路径称之为回路。
  由上述可知,此次将动态有向网络定义为一个时间上的有序图集,其拓扑结构为G=(E,V ),E和V分别为网络某时刻的顶点集和变集,E和V会随着时间的变化而变化,符合动态网络随时间变化的特征。
  2.2 时序分析问题及其解决方法
  2.2.1 时序分析问题
  时序分析问题是此次研究的关键问题,链路预测是网络分析中的一个任务,其可以通过观察到的网络中的链路来预测出网络下一时刻链路,目前在该领域的预测方法只是根据网络特定时刻的状态来预测网络新的链路,其并不适用于动态有效网络,导致网络的时序分析成为链路预测过程中的重要问题。常用的时序分析方法有滑动平均法(Moving Average)、平均分析法(Average)、随机时序分析法(Random Walk)、线性回归分析法(Linear Regression)、指数加权滑动平均法(exponentially weighted moving average)等。
  2.2.2 解决方法
  由于动态有向网络中的链路预测主要是结合网络前T个时刻的信息,预测出网络第T+1时刻的边,针对上文定义的动态有向网络,需要利用时序分析方法对网络所蕴含的时序信息进行分析,针对动态有向网络的链路预测具有一定的随机性,考虑到时间间隔对网络链路预测的影响,此次选择指数加权滑动平均法对网络进行时序分析。对于一个时间序列 ,T+1时刻的预测值可以按照以下公式计算:
  公式(3)中,表示动态有向网络T+1时刻预测值;xT表示时刻的观测值;α为平滑系数。对于公式(3)的求解,只需要将迭代的从网络初始时刻计算,就可以得到动态有向网络T+1时刻的预测值。由于动态有向网络初始时刻并没有对应的预测值,所以要实现上述方法对网络时序分析,还需要对网络初始时刻预测值进行取值[2]。如果动态有向网络存在较少的时间序列,则可以取T0时刻的观测值作为T0时刻的预测值,如果动态有向网络存在较多的时间序列,则可以取序列xT0,xT1,xT2的平均值作为初始时刻的预测值,以此解决对动态有向网络时序分析问题。
  2.3 聚类倾向问题及其解决方法
  2.3.1 聚类倾向问题
  由于动态有向网络中数据节点存在聚类倾向特征,导致在时序链路预测过程中,动态有向网络存在聚类倾向。
  2.3.2 解决方法
  利用聚类算法得到动态有向网络中每个节点的特征,降低预测的维度,对每个网络节点进行聚类分析,解决动态有向网络聚类倾向问题,计算出T+1时刻动态有向网络最短的边,即最短路径,实现时序链路预测[3]。计算每个网络节点到所属类中心的欧式距离,其计算公式如下:
  公式(4)中,表示每个网络节点到所属类中心的欧式距离;表示网络节点在顶点集合中的坐标;表示节点所属类编号的类中心坐标。在不同的类中,网络节点数量是不同的,为了方便了解在不同类中的网络节点距离其各自中心的程度,需要对每个网络节点的欧式距离指标进行规范化,使节点所属类具有相同的权重。为了保留原始网络节点的比例特征,此次采用最大规范化方法来统一网络节点,其公式表示如下:
  公式(5)中,表示规范化后的网络节点间欧式距离;表示类指标的均值;表示类指标的标准差。该规范化将每个类中的网络节点规范到[0,1]区间内。基于动态有向网络中的物理现象,此处给出聚类系数计算公式:
  D的取值如图3所示。
  由于sdist值被规范化到[0,1]区间内,节点x和节点y之和取值为[0,2]区间内,从而聚类系数取值为正弦函数的[0,π]区间内。当两节点之和接近零,此时聚类系数值较低,表明此时动态有向网络不存在聚类倾向,动态有向网络之间两顶点之间的距离最短,此条路径为最短有效路径,将该条路径作为结果输出,精准的预测出动态有效网络时序链路。
  3 实验验证
  在上述环节中对动态有向网络中的网络定义问题、时序分析问题、聚类倾向问题提出相应的解决方法之后,本部分内容通过仿真实验在Facebook-wall中进行了验证,结果如图4所示。
  由图4结果可知,在相同的时间窗口下,该文中在解决上述3个问题之后在动态有向网络中链路预测效果有显著的提升,证明了该文中提出的3种方法的有效性。
  4 结语
  此次针对动态有向网络时序链路预测过程中出现的网络定义问题、时序分析问题、聚类倾向问题进行了研究,并对其提出了相应的解决方法,将研究重点落脚在动态有向网络预测有关问题,有效提高了预测精度。此次研究仍存在优化改进的地方,比如提出的聚类系数存在较强的针对性,不具有较强的普适性,今后还需在该方面进行深入研究,为时序链路预测研究提供理论依据。
  参考文献
  [1]岳增慧,许海云,王倩飞.基于局部信息相似性的学科引证知识扩散动态链路预测研究[J].情报理论与实践,2020,43(02):84-91+99.
  [2]吴晨程,周银座.基于图嵌入法的时序网络链路预测研究[J].杭州师范大学学报(自然科学版),2020,19(05):472-480.
  [3]符汉杰,熊赟,朱扬勇.TLP:一个动态网络中的时序链路预测算法[J].计算机工程,2020,46(01):67-73.
  [4]杜凡,刘群.有向动态网络中基于模体演化的链路预测方法[J].计算机应用研究,2019,36(05):1441-1445+1453.
  [5]杨瑞琪,张月霞.一种时序有向社会网络中的链路预测算法[J].计算机工程,2019,45(03):197-201.
  [6]潘嘉琪,邹俊韬.一种基于深度RTRBM的动态网络链路预测方法[J].计算机技术与发展,2020,30(03):1-6.
  [7]冯译萱,张月霞.一种时序有向网络中的链路预测方法[J].计算机工程与应用,2019,55(21):151-157.
  [8]刘书新,刘群,杜凡.基于模体演化与社区一致性的时序链路预测方法[J].计算机应用研究,2019,36(12):3674-3678+3684.
  [9]刘留,王煜尧,倪琦瑄,曹杰,卜湛.一种基于博弈论的时序网络链路预测方法[J].计算机研究与发展,2019,56(09):1953-1964.
其他文献
摘 要:用聚醚多元醇(PPG)在一定工艺条件下合成汽车顶棚湿法骨架成型用聚氨酯单组分湿固化无溶剂胶粘剂PK-618E1,再分别将20%、50%、80%、100%的PPG用等羟基量的腰果壳油多元醇代替,在相同工艺条件下合成胶粘剂PK-618E2、PK-618E3、PK-618E4、PK-618E5。按汽车顶棚湿法制造两步法工艺制作样件测试对比其开放性、反应性和初粘强度。并通过测试预聚过程中NCO含量
摘 要:以某轨道车辆用丙烯酸胶为研究对象,利用袋式法和9级度量法分别进行VOC测试和愉悦度评价,通过气味活度法筛选发现丙烯酸胶固化1d、7d和21d后的重点气味物质均为苯乙烯;后基于不同臭气浓度下的苯乙烯愉悦度评价结果,建立了苯乙烯愉悦度-臭气指数特征曲线y=0.0056-0.6758x-0.5307x2,在-0.122~2.179的苯乙烯臭气指数范围内相关性良好,相关系数为0.9930。最后,基
摘 要:相比其他高分子分散剂合成方法,大分子单体法更具优势,合成的分散剂质量稳定,工艺简单,所以本文以大分子单体法合成了水溶性高分子绘画颜料分散剂。通过酯化反应制备具备反应活性的大分子单体,并利用溶液聚合法与丙烯酸单体、乙烯基单体发生共聚,以合成了聚醚-聚丙烯酸水溶性高分子绘画颜料分散剂。在此基础上进行了表征实验研究,结果表明,酯化反应温度应严格控制在100~120℃;分散剂表面张力降低效果显著,
摘 要:室内装修装饰的大量涌现,使得室内化学污染物超标现象日趋严重,现代人已经继第一污染时期—煤烟型污染和第二污染时期—光化学烟雾污染后,进入以室内化学污染为标志的第三污染时期,为此提出装修产生的室内化学气体污染防治方法研究。根据室内化学气体质量浓度范围,选择膨化土钠化改性、酸化改性、有机改性制备方案;将制备后的膨化土搭配空气净化装置,设定合理的位置和放置时间,对装修产生的室内化学气体进行净化。经
摘 要:线缆收缆打包的方式严重影响生产效率,缆径越大,劳动强度就越高,为实现线缆自动取长、切缆及收缆,设计研究了一种定长取缆自动控制系统。该系统包括上料小车、放线龙门、对中装置、履带牵引、收线龙门和自动控制系统。上料小车通过预埋轨道将线缆盘送至龙门;放线龙门为框架式结构,采用变频控制方式,完成线缆盘的夹紧、升降和放线;履带牵引采用气压式夹紧方式,提供恒定的牵引力,并可实时计米;对中装置将线缆准确保
为考察除垢对原生污水源热泵换热器传热与磨损的影响,文章采用模型实验方法,以自制原生污水换热器为实验模型,以粒径为2~3 mm,体积分数分别为3%,5%的沙粒和聚四氟乙烯颗粒为流态化除垢粒子,研究流态化在线除垢法对原生污水换热器的除垢效果,以及对换热管的磨损程度。实验结果表明:利用流态化在线除垢法对结垢污水换热器进行除垢的效果明显;分别采用体积分数为3%,5%的沙粒和聚四氟乙烯颗粒对结垢污水换热器进行除垢后,污水换热器的换热系数分别提升了38.27%,39.72%,22.77%和38.87%,污垢热阻分别降
实际输入海浪的不确定性,导致直驱式波浪能发电系统工作环境中的噪音点多,传统控制策略控制效果不佳,输出功率低。文章通过分析水动力结构模型与直线电机模型,构建了等效电路;采用加窗傅里叶变换离散化不规则激励,获取频域主导激励分量及波浪能发电系统最大功率捕获条件,以确定最佳电磁力;基于d,q轴电流环矢量控制模型,设计了自抗扰控制方案,降低了激励输入噪音的影响,保证了电流跟踪效果。仿真结果表明,自抗扰控制策略的跟踪效果与滤波效果较好,抗干扰能力较强,系统功率输出优化效果明显,鲁棒性强。
浮式风机已成为开发海上风能的新趋势。文章基于OC4-DeepCwind半潜式平台,设计了一种具有倾斜立柱的新型半潜式平台,并根据势流理论对上述两种平台的水动力性能进行了频域与时域的对比分析及可靠性验证。同时研究了缆索数量、缆索连接点高度与锚固点位置对平台运动响应的影响,提出了一种优化系泊系统的新平台。研究结果表明:新平台的质量与排水体积大大降低;新平台纵荡、垂荡与纵摇RAO峰值明显减小,垂荡固有周期增加,能有效防止共振现象发生;新平台的垂荡与纵摇明显降低,纵荡的改变较小;与原有系泊系统相比,优化后系泊系统
摘 要:为分析酸蚀粘接剂对牙本质与玻璃陶瓷粘接界面封闭性能影响,以便为临床选择粘接材料提供参考,选取SinglebondTM Universal、Prime Bond NT、Clearfil SE Bond3种粘接剂粘接牙本质与玻璃陶瓷,形成粘接试件,然后分为即刻测试组、人工唾液组、细菌侵袭组等3种情况,进行银染测试,观测银染颗粒渗漏情况,计算纳米渗漏数值,以得出粘接界面封闭性能。结果表明:①即刻
文章基于Ecotect软件和Radiance软件的协作交互,研究了光伏外遮阳(外置光伏板和光伏百叶结构)的变化对室内采光效果和光伏发电量的影响。研究结果表明:在南京地区,外置光伏板长度的变化对DA和DF影响较大;光伏百叶结构透明度的增大能够显著提升DA和DF;当采用光伏外遮阳时,适宜的窗墙比可使室内仅依靠自然采光达到最低采光限度(300 lux)的时间占比达到70%以上。此外,不同的光伏外遮阳倾角对各月发电量的影响不同,当光伏外遮阳的倾角为15°时,各月发电量均高于光伏外遮阳倾角为90°的工况,因此,可每