关于带递归效用的平均场最优控制问题的随机最大值原理

来源 :山东大学 | 被引量 : 0次 | 上传用户:luckyxiaoxi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Peng[1]在1998年提出一个重要的公开问题:“除了一些特殊情形,当f非线性依赖于z时相应的全局最大值原理是一个公开问题”。[2]和[3]研究了这个公开问题,但是他们所得到的最大值原理仍包含未知参数。公开问题的主要难点在于倒向随机微分方程(简记为BSDE)的生成元f(x,y,z,u)是非线性依赖于z的,这是无论在理论还是实际生活中都存在的一种典型状态。2015年Hu[4]最终解决了这个历时已久的公开问题。在Hu[4]的基础上,本文将结论推广至平均场情形,并考虑了完全耦合的部分可观测的平均场随机最优控制问题。本文主要分为两部分。  第一部分,我们研究带递归效用函数的平均场最优控制问题的随机最大值原理。我们得到了带递归效用函数的平均场倒向随机微分方程(简记为MFBSDE)的变分方程,且得到了新的最大值原理。控制域不必为凸且MFBSDE的生成元可包含z。我们考虑如下状态方程:{dx(t)=b(t,x(t),Ex(t)],u(t))dt+σ(t,x(t),E[x(t)],u(t))dW(t),(1)x(0)=x0.  我们定义代价泛函:J(u(·))=y(0),(2)  其中y(·)为以下MFBSDE的解:dy(t)=-f(t,x(t),E[x(t)],y(t),E[y(t)],z(t),E[z(t)],u(t))dt+z(t)dW(t),(3)y(T)=φ(x(T),E[x(T)]).  带递归效用的平均场随机最优控制问题为在可容许控制集u[0,T]上最小化(2)式中的代价泛函J(u(·)),即找到最优控制ū,使得J(ū(·))=u(·)inf∈u[0,T],J(u(·)).  我们的目的是得到最小化代价泛函时,最优控制ū(·)所能满足的条件。我们的主要思想是利用Ekeland变分原理以及相应的伴随方程得到最优控制的必要条件。本部分的主要难点在于:(1)如何得到MFBSDE的二阶变分方程的具体形式(与[15]不同)。(2)关于z的变分方程的二次形式导致二阶伴随方程十分复杂。  第二部分我们考虑了一种完全耦合的正倒向随机系统的部分可观测的平均场随机最优控制问题。在正向扩散系数不包含控制变量且控制域不必为凸的假设下,由Ekeland变分原理并利用针状变分法,我们得到庞特里亚金型的最大值原理,并且相关的伴随过程为平均场情形下的正倒向随机微分方程(简记为FBSDE)的解。而完全耦合的正倒向随机最优控制问题的一般最大值原理仍是一个公开问题。  我们定义如下代价泛函:J(u(·))=Eu[∫T0 l(t,xu(t),E[xu(t)],yu(t),E[yu(t)],zu(t),E[zu(t)],u(t))dt(4)+φ(xu(T),E[xu(T)])+γ(yu(0))],约束于受控的完全耦合的平均场FBSDE:dxu(t)=b(t,θu(t),u(t))dt+σ(t),θu(t))dW(t),dyu(t)=-f(t,θu(t),u(t))dt+zu(t)dW(t),(5)xu(0)=x0,yu(T)=g(xu(T),E[xu(T)]),t∈[0,T].其中θu(t)=(xu(t),E[xu(t)],yu(t),E[yu(t)],zu(t),E[zu(t)]),以及部分观测dY(t)=h(t,xu(t),E[xu(t)],yu(T0,E[yu(t)],u(t))出+d(W)(t),Y(0)=0.(6)当系数满足Lipschitz条件、可积性条件和G-单调性条件时,方程(5)存在唯一解,其中正向扩散系数不包含控制。我们应用Ekeland变分原理及相应的伴随方程得到完全耦合情形下的部分可观测的平均场随机最大值原理。
其他文献
近年来,信息聚合理论在应用方面取得了举世瞩目的成功。它的理论和方法在医学、经济、管理和军事等诸多领域中得到了广泛的应用。在信息聚合理论中,国内外的众多学者提出了各种
本文考虑各向异性薛定谔方程问题{-ε2div(A(x)▽u)+u+V(x)u=|u|p-1u,x∈RN,u→0,|x|→∞,解的存在性。其中,当N=1,2时,p>1,当N≥3时,1<p<N+2/N-2,A(x)是对称矩阵,其元素有界可测。  
本文从城市规模和经济密度两个视角,结合江苏省13个地级市市辖区的统计数据,通过检验城市规模、经济密度对城市生产率的估计值大小,来判断江苏省城市化经济效应是否存在及作用强
本文研究了几类中立型不确定时滞系统的保成本控制问题。实际系统中,存在着时滞现象和各种各样的不确定性,从而可能导致系统的不稳定。因此在控制系统中,需要设计一个优质的控制
机器翻译系统具有巨大的社会效益和经济效益,并且随着中国经济的迅速发展和国力的不断增强,汉语正在成为一种新的强势语言而被世人瞩目,因此汉英机器翻译的研究显得越来越重
用偏微分方程进行图像处理始于20世纪90年代,几十年来,以P-M模型为基础,经过众多专家学者的不懈努力,Catte模型、Alvarez-Lions-Morel模型、全变差(TV)模型等很多成熟与高效
变量选择在统计分析中是一个很重要的话题,而删失数据在实际生活中也十分常见。本文的主要研究是为变系数模型提供系统的变量选择方法,也为固定删失数据的分位数回归给出一种简