论文部分内容阅读
天基海洋移动目标监视具有覆盖区域广、安全性高、不受空域国界和地理条件限制等优点,在军事需求和民事应用中具有突出的战略意义和民用价值。当前如何充分利用卫星及其有效载荷,满足海洋移动目标监视的信息需求,增强海洋移动目标监视效能,是一个重要而紧迫的研究课题。海洋移动目标的动态性、卫星及其载荷类型的多样性给卫星任务计划编制增加了难度,只有建立有效的运行控制模式和多星联合调度的模型、算法,才能较好地安排观测任务、合理分配卫星资源。基于上述研究背景,本文主要研究工作和创新点体现在以下几个方面。(1)对天基海洋移动目标监视联合调度问题的系统分析和形式化描述,建立联合调度问题的一般模型。系统分析了海洋移动目标、监视环境和卫星调度资源的特点。分析了海洋移动目标监视联合调度问题的不确定因素和业务流程,给出了联合调度问题的基本假设。对监视区域网格划分、过境观测窗口、联合调度任务、观测行动集、行动策略与优化目标等要素进行了定性和定量分析,给出了形式化描述。根据优化目标的短期性和长期性收益,建立了单阶段联合调度模型、反馈延时的单阶段联合调度模型和多阶段联合调度模型。(2)提出卫星与地面目标的时空关系计算方法。提出了卫星与地面目标的时空计算方法,为调度预处理、目标与观测行动影响关系提供辅助计算支持。其中,侧摆观测算法根据已知卫星星下点位置和侧摆角,计算视场中心所观测的地面目标点位置。侧摆角及观测时刻算法用以确定卫星对目标的观测时刻及对应侧摆角。观测条带的网格覆盖检测算法用以判断卫星观测条带与监视区域中网格的覆盖关系。(3)改进和扩充海洋移动目标运动预测方法,提出多模型运动预测方法。在目标不易区分情况下,运用带随机扰动的匀速运动预测方法。在目标可明确区分情况下,通过集成匀速运动预测、航迹变更预测、基于航迹的预测和潜在区域预测,根据预测前若干阶段中目标位置与各备选方法预测值的比较,在备选方法中选择当前预测阶段适宜采用的方法,建立多模型运动预测方法。(4)提出海洋移动目标跟踪的粒子滤波算法。根据海洋移动目标特点和监视应用要求建立无数据关联的粒子滤波算法。算法根据多个移动目标的间隔距离自适应地选择目标粒子抽样方式,在无数据关联条件下目标区分的计算负担和目标状态估计精度两方面平衡算法的性能;运用Kmeans聚类方法调整粒子中对应不同目标的划分排序;引入地理约束对粒子权重的修正因子,处理位于大陆、岛屿等目标不可达区域的粒子。(5)提出基于信息度量的单阶段联合调度方法。对Kullback-Leibler(KL)散度、信息熵、目标状态概率最大化的不同行动策略进行统计分析,在统计意义下论证了基于KL散度的观测行动收益最大化是较优的行动策略。给出了概率分布抽样粒子描述的单阶段期望收益表达式,以观测条带覆盖网格内期望信息收益最大化为行动策略,建立基于信息度量的单阶段联合调度算法。进一步考虑不同卫星过境观测窗口邻近或重叠时不能及时得到观测结果的影响,提出考虑反馈延时的单阶段联合调度算法。(6)提出基于强化学习的多阶段联合调度方法。以长期观测收益最大化为优化目标,研究多阶段联合调度方法。分析了强化学习算法在本文研究背景下的应用优势。以期望信息收益作为强化学习算法的状态描述。考虑到实际应用中不同卫星遥感器可能具有不同控制或观测参数而导致离散行动规模不一致的缺陷,在连续行动空间建立行动集和行动选择方法。给出状态行动对的值函数以及使用神经网络近似估计值函数的学习算法,在连续行动空间上建立基于强化学习的多阶段联合调度算法。(7)基于仿真的应用研究。通过仿真结构、流程和想定设计、调度预处理过程以及调度结果分析,给出更为贴近实际应用背景的仿真案例,验证本文提出方法的有效性。