论文部分内容阅读
动态频谱接入技术是认知无线网络研究的重要内容之一,其实现方式包括动态授权和动态频谱共享等。动态频谱共享技术将频谱资源同时授予多个网络,使频谱资源得到共享。本文的主要研究方向就是动态频谱接入技术。本文将主要分析,当多个频谱资源由多个网络(用户)共享时,用户应该采用怎样的频谱接入策略。本文首先分析了考虑信道切换损耗的单用户多信道网络。在用户无法获知信道质量先验信息的情况下,通过假设信道在不同时刻的信道质量具有参数化的独立同分布特性,本课题提出了一种改进的Lai-Robbins接入策略。该策略将用户多信道接入问题建模为MAB(Multi-Armed Bandit)问题,以实现用户收益的最大化。通过理论分析证明,该算法的收益损失随着时间增长的速度能够达到理论上最优的对数阶数。考虑到上述算法在实现过程中存在频繁的信道切换,因而存在较大的增长系数,为了减少收益损失,本文提出了RSAP(ReduceSwitch with Advanced Play)策略,并给出了RSAP策略的收益损失的理论分析。在RSAP策略中,收益损失随着时间依然以对数阶数增长,但是由于较低的信道切换次数而具有较低的增长系数。接着本文对多用户异构网络的动态频谱接入技术进行了分析。在异构网络中,用户在接入不同类型的接入点时具有不同形式的收益函数,且同一信道对不同接入用户具有不同信道质量。在本课题分析中,允许多个用户同时接入同一个信道。当多个用户接入同一个信道时,所有接入该信道的用户的收益均会下降。本文将该问题建模为收益函数与用户相关的非对称单元素拥塞博弈问题,并证明了该博弈问题存在纯策略纳什均衡点。由于收益函数未知,这是一个不完全信息博弈问题,用户需要在博弈的动态过程中学习外界环境,逐渐找到对自己最有利的策略。为了解决该问题,本文提出了较优响应分布式学习算法,并且证明在该算法下,用户的策略最终将收敛到纳什均衡点。