论文部分内容阅读
Peng[1]在1998年提出一个重要的公开问题:“除了一些特殊情形,当f非线性依赖于z时相应的全局最大值原理是一个公开问题”。[2]和[3]研究了这个公开问题,但是他们所得到的最大值原理仍包含未知参数。公开问题的主要难点在于倒向随机微分方程(简记为BSDE)的生成元f(x,y,z,u)是非线性依赖于z的,这是无论在理论还是实际生活中都存在的一种典型状态。2015年Hu[4]最终解决了这个历时已久的公开问题。在Hu[4]的基础上,本文将结论推广至平均场情形,并考虑了完全耦合的部分可观测的平均场随机最优控制问题。本文主要分为两部分。 第一部分,我们研究带递归效用函数的平均场最优控制问题的随机最大值原理。我们得到了带递归效用函数的平均场倒向随机微分方程(简记为MFBSDE)的变分方程,且得到了新的最大值原理。控制域不必为凸且MFBSDE的生成元可包含z。我们考虑如下状态方程:{dx(t)=b(t,x(t),Ex(t)],u(t))dt+σ(t,x(t),E[x(t)],u(t))dW(t),(1)x(0)=x0. 我们定义代价泛函:J(u(·))=y(0),(2) 其中y(·)为以下MFBSDE的解:dy(t)=-f(t,x(t),E[x(t)],y(t),E[y(t)],z(t),E[z(t)],u(t))dt+z(t)dW(t),(3)y(T)=φ(x(T),E[x(T)]). 带递归效用的平均场随机最优控制问题为在可容许控制集u[0,T]上最小化(2)式中的代价泛函J(u(·)),即找到最优控制ū,使得J(ū(·))=u(·)inf∈u[0,T],J(u(·)). 我们的目的是得到最小化代价泛函时,最优控制ū(·)所能满足的条件。我们的主要思想是利用Ekeland变分原理以及相应的伴随方程得到最优控制的必要条件。本部分的主要难点在于:(1)如何得到MFBSDE的二阶变分方程的具体形式(与[15]不同)。(2)关于z的变分方程的二次形式导致二阶伴随方程十分复杂。 第二部分我们考虑了一种完全耦合的正倒向随机系统的部分可观测的平均场随机最优控制问题。在正向扩散系数不包含控制变量且控制域不必为凸的假设下,由Ekeland变分原理并利用针状变分法,我们得到庞特里亚金型的最大值原理,并且相关的伴随过程为平均场情形下的正倒向随机微分方程(简记为FBSDE)的解。而完全耦合的正倒向随机最优控制问题的一般最大值原理仍是一个公开问题。 我们定义如下代价泛函:J(u(·))=Eu[∫T0 l(t,xu(t),E[xu(t)],yu(t),E[yu(t)],zu(t),E[zu(t)],u(t))dt(4)+φ(xu(T),E[xu(T)])+γ(yu(0))],约束于受控的完全耦合的平均场FBSDE:dxu(t)=b(t,θu(t),u(t))dt+σ(t),θu(t))dW(t),dyu(t)=-f(t,θu(t),u(t))dt+zu(t)dW(t),(5)xu(0)=x0,yu(T)=g(xu(T),E[xu(T)]),t∈[0,T].其中θu(t)=(xu(t),E[xu(t)],yu(t),E[yu(t)],zu(t),E[zu(t)]),以及部分观测dY(t)=h(t,xu(t),E[xu(t)],yu(T0,E[yu(t)],u(t))出+d(W)(t),Y(0)=0.(6)当系数满足Lipschitz条件、可积性条件和G-单调性条件时,方程(5)存在唯一解,其中正向扩散系数不包含控制。我们应用Ekeland变分原理及相应的伴随方程得到完全耦合情形下的部分可观测的平均场随机最大值原理。