论文部分内容阅读
针对传统攻击图生成算法效率低和生成攻击图规模小的问题,文中提出一种基于Q-leaming机制的攻击图生成的方法。该方法根据Q-leaming机制的特征,将攻击者模拟成智能体对网络进行连续的漏洞攻击。智能体的每一次场景作为攻击图中的一个攻击路径。由于智能体的场景之间是独立的,因此可以通过分布式的方式进行攻击图的生成。文中将攻击者的攻击目标作为智能体学习场菁的收敛状态。当智能体经过47次的场詈学习过程,Q-leaming中的Q函数积累值收敛为1548.14时,攻击图生成结束。仿真结果表明通过Q-leaming