论文部分内容阅读
随着物联网技术的普及,无线射频识别技术(Radio Frequency Identification,RFID)被越来越广泛地应用到各行各业中,如仓储物流,零售,制造业,服务业,身份识别等等。射频识别是当前国际发展最迅速的新技术之一,它具有非接触性、识别距离远、抗干扰能力和环境适应性强、保密性高等优点。在RFID系统的实际应用中,往往需要在一个区域内布置大量阅读器,当这些阅读器同时以同一频率与标签通信,阅读器分辨不出标签的响应信号时,就会引发阅读器间的碰撞。在实际生活中有许多密集型阅读器的应用系统,阅读器之间的碰撞也必然存在;随着强化学习的兴起,由于它具有自我修正和反馈的机制,适用于多阅读器选择信道的模型,所以本文研究的重点是基于强化学习的RFID系统中的多阅读器防碰撞算法,本文的主要研究内容和创新点如下:1、提出一种基于Q学习的多阅读器防碰撞算法。该算法对HiQ算法进行了有效改进,取消了HiQ算法中复杂的分层结构,运用ε贪婪策略,改进奖赏函数,并且通过智能算法自适应地与周围环境交互和学习,产生Q值函数,得到最佳信道分配策略。仿真结果表明,当阅读器数目为9时,与HiQ相比,本算法的频率碰撞率降低了28.60%,与EHiQ算法相比,本算法的频率碰撞率降低了 36.03%;当阅读器数目为16时,与HiQ相比,本算法的频率碰撞率降低了 31.08%,与EHiQ算法相比,本算法的频率碰撞率降低了47.74%;当阅读器数目为25时,与HiQ相比,本算法的频率碰撞率降低了 54.94%,与EHiQ算法相比,本算法的频率碰撞率降低了67.03%。2、提出一种基于深度Q网络的多阅读器防碰撞算法。该算法将Q学习算法的思想与神经网络结合,通过定义状态和动作,建立记忆库,更新神经网络的权重,然后找到一个最佳策略分配信道资源。仿真结果表明,当阅读器数目为49时,与HiQ算法相比,本算法的频率碰撞率降低了10.77%,与EHiQ算法相比,本算法的频率碰撞率降低了35.52%;当阅读器数目为64时,与HiQ算法相比,本算法的频率碰撞率降低了35.78%,与EHiQ算法相比,本算法的频率碰撞率降低了46.27%。