【摘 要】
:
针对现有智能路由技术无法适用于动态拓扑的不足,提出了一种面向动态拓扑的深度强化学习智能路由技术,通过使用图神经网络近似PPO(Proximal Policy Optimization)强化学习算法中的策略函数与值函数、策略函数输出所有链路的权值、基于链路权值计算最小成本路径的方法,实现了路由智能体对不同网络拓扑的泛化。仿真结果表明,所提方法可适应动态拓扑的变化并具有比传统的最短路由算法更高的网络吞吐量。
论文部分内容阅读
针对现有智能路由技术无法适用于动态拓扑的不足,提出了一种面向动态拓扑的深度强化学习智能路由技术,通过使用图神经网络近似PPO(Proximal Policy Optimization)强化学习算法中的策略函数与值函数、策略函数输出所有链路的权值、基于链路权值计算最小成本路径的方法,实现了路由智能体对不同网络拓扑的泛化。仿真结果表明,所提方法可适应动态拓扑的变化并具有比传统的最短路由算法更高的网络吞吐量。
其他文献
介绍高压电动机热过负荷保护的原理、整定计算及试验方法,热过负荷保护已广泛应用于电动机装置,与常规的过电流保护相比较,具有显著优越性和推广应用价值.
海上风电机组对运行可靠性要求较高.风电机组由于采用了变流器励磁控制,存在共模干扰问题,如果机组配电回路设计不合理,可能导致共模干扰影响机组运行的可靠性.针对某型兆瓦
当前在电网改造升级的推动下,海上油气田对更大容量、更高额定电流的中压开关设备产品需求不断提高.但目前常规中压断路器固封极柱因紧固连接失效常常导致产品无法可靠运行,
以实际工程为例,详细叙述了地下空间的照明设计,从选择光源、灯具开始,对灯具布置做了具体分析,并对照明控制方式进行说明介绍.重点对汽车库照明的设计过程进行了实例计算分
定量划分谐波责任对于电能质量管理具有重要意义.提出一种基于数据筛选进化机制的多谐波源谐波责任划分方法.在传统的线性回归法估算回归系数中,回归模型往往会受到数据中异
超大城市综合体项目建筑功能复杂、占地面积及火灾荷载大,线路敷设距离长.发生火灾后,火灾蔓延速度快,人员疏散逃生难,灭火救援难度大,极易造成重大人员伤亡和财产损失.结合
综述了空间飞行器的精密定轨对世界时测量的需求,并对现有大型激光陀螺、光纤陀螺测量世界时的现状与前景进行了分析,阐述了大型高精度光纤陀螺用于世界时测量需重点解决的关键技术,对实现的大型高精度光纤陀螺样机进行了试验验证,零偏不稳定性达到了5.2×10-6(°)/h(1σ),同时对陀螺长期运行期间探测到的青海玛多地震情况进行了分析,最后对面向更高精度的世界时测量用大型光纤陀螺发展方向进行了展望。
金属锂电池在高比能特性方面具有超高的优势,近年来重新获得了储能领域的广泛关注与研究。科研工作者针对金属锂电池锂枝晶生长导致的循环稳定性差和严重的安全问题进行技术攻关,在材料层面对金属锂负极界面保护进行了大量研究。但由于材料和电池器件之间的差距,难以将现有金属锂负极界面保护的研究进展实现实际应用。该研究基于金属锂负极软包电池,研究了不同类型原位保护层对电池循环稳定性的影响,通过对含氟界面保护层和含硅界面保护层在金属锂负极软包电池中的结构和电化学性能进行对比,优选出工程化适用性高,结构性能稳定的锂负极保护方案
对弹道导弹惯性测量系统进行误差分析和精度指标分配是保证导航精度和武器作战性能的一项重要任务。针对目前惯性导航系统误差分析不全面、精度评估准则单一以及精度指标分配方法不准确的不足,提出了一种弹道导弹惯性测量系统精度指标自适应分配方法,能够按照误差项对精度的影响合理化分配精度指标。该方法首先分析了影响导航精度的所有误差项,并对比各误差项对导航精度的影响。其次,根据总体精度要求值和各误差源在落点精度中的占比,对每项误差系数进行自适应分配,通过逐次调整落点精度中占比最大误差项,最终实现精度指标要求下的最优误差系数
对于机载捷联惯性卫星组合导航系统而言,当载机处于大动态或者其他卫星信号不连续情况时,卫星提供的速度、位置等量测信息可能会出现跳变,进而影响组合导航精度。介绍了惯性导航、卫星导航及其组合导航系统的基本原理和优缺点,分析了卫星量测不可避免出现跳点时组合导航系统Kalman滤波器的估计效果,对基于惯性辅助的卫星信息容错技术进行研究,提出了一种新的卫星信号野值剔除与滤波改进方法。新方法既保证了量测向量原有的统计特性,同时将野值带来的影响去除。半实物仿真分析结果表明,滤波器的估计稳定性得到明显提升,组合导航系统的速