论文部分内容阅读
不确定微分博弈是研究博弈参与人在其控制策略和状态共同由一个不确定Liu过程驱动的微分方程描述的动态系统约束下,如何实现各自最优目标的博弈理论。本学位论文主要研究三类不同的不确定动态系统下的微分博弈理论,并且主要研究零和博弈的鞍点均衡、非零和博弈的Nash均衡和主从博弈的Stackelberg均衡问题。研究方法主要是利用不确定最优控制的极大值原理和不确定微分博弈理论中常用的配方法和构造法。论文首先研究由典范Liu过程驱动的三类不确定动态系统的非合作微分博弈的鞍点均衡、Nash均衡和Stackelberg均衡问题,着重研究博弈均衡策略存在的充分必要条件以及均衡策略的显式解和数值求解方法。其次,利用数值例子验证和演示各种均衡策略求解方法的有效性。最后,将所得结果应用于企业R&D投入协同创新管理问题,及最优积累问题和企业投资决策问题。具体研究结果如下:(i)首先,研究了由典范Liu过程驱动的仿线性不确定微分系统的最优控制问题,得到了最优控制解存在的充分必要条件及其最优控制的显式表达式。其次,研究了仿线性不确定微分系统的鞍点均衡问题和Nash均衡问题,探讨了两类均衡问题存在的充分必要条件以及均衡策略的显式表达式。结果表明,均衡策略都依赖于一个关键的Riccati方程的解。有限时间情形下,该关键的Riccati方程为一组耦合的Riccati方程和倒向微分方程;而定常系统无限时间情形的均衡策略依赖于状态以及耦合的代数Riccati方程和倒向微分方程的解。(ii)针对由典范Liu过程驱动的不确定线性系统以及博弈性能指标为二次型的Stackeberg博弈均衡问题,研究了其最大值原理,得到了该博弈的Stackeberg均衡解存在性条件,并将所得结论应用于企业R&D投入协同创新管理问题,给出了企业最优的R&D投入策略、补贴比例和双方的最优利益。(iii)研究了不确定线性时滞系统的微分博弈鞍点均衡问题和Nash均衡问题。首先探讨了控制输入含时滞的不确定线性时滞系统的鞍点均衡问题和Nash均衡问题,利用最优性原理和配方法,分别得到有限时间情形下鞍点均衡策略和Nash均衡策略的存在性条件是对应的耦合Riccati微分方程存在解,并给出数值例子验证和演示两种均衡策略的求解方法。其次,研究了系统状态含时滞的不确定线性时滞系统的鞍点均衡问题和Nash均衡问题,利用最优性原理和配方法,分别得到有限时间情形下鞍点均衡策略和Nash均衡策略的存在性以及策略设计所依赖的耦合Riccati微分方程的形式,也给出数值例子验证和演示两种求解均衡策略方法的有效性,并且讨论了其在资本积累中的应用。(iv)研究了带跳的不确定线性系统的问题鞍点均衡问题和Nash均衡问题,利用极大值原理和配方法,分别得到有限时间情形下鞍点均衡策略和Nash均衡策略的存在性以及策略设计所依赖的耦合Riccati微分方程的形式,并给出数值例子验证和演示两种均衡策略求解方法的有效性,并且讨论了其在企业投资决策中的应用。