论文部分内容阅读
马尔科夫决策过程MDP是一种强化学习的基本框架,通过对马尔科夫决策过程采用的时间差分TD算法、神经网络反向传播BP算法和遗传算法等强化学习算法的研究及结合现实中复杂的网络故障,构造了一种解决复杂网络故障的智能体强化学习的网络故障模型。通过该模型能够智能诊断和预测复杂的网络故障,为快速抢通恢复网络故障提供了重要的智能手段。