论文部分内容阅读
自适应波形选择在雷达、声纳和认知无线电等领域中有着广泛的应用。尤其在近几年,加拿大Haykin教授提出“认知雷达”概念以后,波形自适应选择方法受到国内外众多学者的关注。在实际应用中,由于目标本身的多样化和高速运动等特性导致电磁环境变得更为复杂,使得雷达系统在实时地进行发射波形选择和参数调整方面面临着严峻的挑战。基于自适应动态规划的波形优化选择方法可以通过与环境的交互和学习,实时地实现环境认知,利用环境认知参数对发射波形进行优化求解,使得发射波形自动适应不同电磁环境,从而使得雷达系统根据环境变化实时地选择发射波形和调整参数等方面成为可能。本文阐述了雷达波形设计方法的发展过程,系统地分析了传统波形设计、信息论波形设计等方法,并对基于自适应动态规划的波形选择方法进行了深入研究。在此基础上分析了马尔可夫决策过程模型下自适应波形选择问题的求解方法,给出了波形选择的贝尔曼最优方程。进而针对检测雷达实际应用背景,提出两种求解最优波形控制序列的方法:1.针对有限域自适应动态规划波形优化选择问题,本文采用反向动态规划求解方法,获得一组最优发射波形控制序列。2.针对以目标观测状态转移概率为已知条件的传统价值函数迭代方法中难以求解目标观测状态转移概率问题,提出了一种避免求解目标观测转移概率的求解方法—Q-learning方法,在一定程度上降低了贝尔曼最优方程求解问题的计算复杂性、减少了算法计算量和计算机存储容量,实现了对最优波形序列进行快速求解。理论研究表明利用该方法求解的发射波形控制序列仅次于反向动态规划方法得出的最优发射波形控制序列,因此该方法具有更高的实际应用价值。理论分析和计算机仿真实验表明上述两种方法切实可行、有效并且易于实现。