论文部分内容阅读
由于无线传感器网络节点的能量主要消耗在数据的传输上,因此路由选择的有效性决定网络整体能量消耗的高低。本文将网络构建成一个多Agent系统,将系统建模成为一个离散Markov决策过程,使用基于性能势的Q学习算法寻找最优路由。在报酬函数的设定时综合考虑节点距离Sink节点的跳数、邻居节点密度和剩余能量等因素,以达到数据传输最短路径和节点能量消耗的折中。