【摘 要】
:
本文讨论了一类在部分信息下具有确定性系数的带跳平均场类型的线性二次最优控制以及二人零和微分对策问题,分成以下两个部分.第一部分讨论了在部分信息下带跳平均场类型的线性二次最优控制问题.其中,状态方程包含仿射项,是一个由多维布朗运动和泊松随机鞅测度共同驱动的随机微分方程;二次性能指标含有交叉项.另外,不论是状态方程还是性能指标,都包含了状态和控制本身以及它们的期望,这就是所谓平均场类型的最优控制问题.
【基金项目】
:
国家自然科学基金(No.11871121); 浙江省自然科学基金重点项目资助(No.Z22A013952);
论文部分内容阅读
本文讨论了一类在部分信息下具有确定性系数的带跳平均场类型的线性二次最优控制以及二人零和微分对策问题,分成以下两个部分.第一部分讨论了在部分信息下带跳平均场类型的线性二次最优控制问题.其中,状态方程包含仿射项,是一个由多维布朗运动和泊松随机鞅测度共同驱动的随机微分方程;二次性能指标含有交叉项.另外,不论是状态方程还是性能指标,都包含了状态和控制本身以及它们的期望,这就是所谓平均场类型的最优控制问题.对该问题的研究,首先,证明了该环境下最优控制的存在唯一性;其次,引入状态方程的对偶方程,利用对偶方法,得到最优控制的哈密顿系统刻画;接着,利用解耦技术,推导出两个Riccati方程,得到部分信息下最优控制的反馈表示;然后,证明Riccati方程解的存在唯一性;最后,作为应用,讨论了一个特例,通过滤波理论得到相应最优控制的反馈表示.第二部分讨论了在部分信息下带跳平均场类型的线性二次二人零和微分对策问题.首先,得到开环鞍点满足的平稳性条件;其次,通过二人零和微分对策中两个决策者的相互作用引入两个Riccati方程,利用经典的变分技术和配方法建立了部分信息下开环鞍点的状态反馈表示及最优对策值函数;接着,证明开环鞍点的存在唯一性;最后,讨论了该问题的一个特例,并且得到相应开环鞍点的反馈表示.
其他文献
《劳燕》是知名作家张翎的代表作之一,自2017年出版后,屡屡获奖,好评如潮。该书多向交叉的叙事视角与跨越时空的叙事方式让一众中国学者津津乐道。2020年该书由知名译者白雪丽译为英文,由中国文化译研网与亚马逊机构合力出版发行,随即因其独特的叙事吸引了众多海外读者,并荣登亚马逊中国文学与二战文学销售榜榜首。社会叙事理论关注读者的能动作用,关注社会历史语境和意识形态对作品创作与接受的影响。当前全球疫情、
随着社会经济的高速发展,工业现代化带来的环境污染日益严重的问题,尤其是一些有毒有害气体的排放,对人们生命健康造成了严重危害。因此对大气有害气体实现高灵敏的检测对环境保护具有重要意义。在众多气体检测方法中,基于多通池的气体吸收光谱技术由于具有灵敏度高、探测极限低等优势成为目前的一个研究热点。光学多通池利用光学反射原理可以在有限空间内延长光与气体相互作用长度,从而提高光谱检测技术的性能。传统类型的多通
世界城市化趋势下,区域可持续性发展成为研究重点,如何协调好城市化发展与地理环境的关系成为人们普遍关注的新焦点。随着社会经济发展,钱塘江流域内各县市居民区迅速扩张,但是受自然条件限制,流域内部及不同流域间的发展存在显著差异。通过探究地理环境与流域内居民区之间相互作用机制,可以挖掘更有价值的结论从而推进钱塘江流域内可持续城市化发展。本文以钱塘江流域为研究区域,依据河流水系归属,将钱塘江流域划分为新安江
羰基硫(COS)和一氧化二氮(N2O)分子在大气循环中均扮演着重要的角色,其解离产物所涉及的光化学过程对臭氧层的消耗及破坏作用随着工业化进程中的过度排放而日益显著。此外,COS和N2O均是典型的三原子分子体系,它们拥有几乎相同的几何构型和电子价态。因此,关于COS和N2O的光解动力学研究在过去的几十年里一直备受人们的关注。目前,受制于真空紫外光技术,COS和N2O的光解实验研究大多局限于紫外波段,
科技创新是引领国家发展的新动力,是改变世界格局的关键力量,是增进人民福祉的重要手段。当前,全球正在进行新一轮科技革命,与时俱进,加强对科技创新的部署是历史发展的大趋势,要实现我国高质量发展必须贯彻创新驱动发展战略。党中央、国务院已把长江三角洲区域一体化建设提上国家战略高度,这标志着G60科创走廊已然成为长三角区域发展战略中的一个重要战略平台,为长三角地区经济高质量发展催生新动能,创造发展新机遇。因
威廉姆·伍德维尔·洛克希尔(W.W.Rockhill),中文名为柔克义,他是19世纪末20世纪初美国著名的学者兼外交家。柔克义于1884年第一次到中国,任职美国驻华公使馆二等参赞,从此与中国结下了不解之缘。19世纪末,国际局势发生巨大变化,美国经济一跃成为世界第一,国内的市场无法满足商品销售,需要向海外扩张,寻求新的商品市场,于是美国将目光投向东亚地区。但近代美国外交的重点一直在欧洲,政府高层对这
总初级生产力(Gross Primary Productivity,GPP)是植被在单位时间单位面积上生产的全部有机物量,精准评估陆地生态系统GPP的时空格局,对理解全球碳循环过程和实现“双碳”目标有重要的现实意义。太阳辐射中的散射辐射作为重要环境因素,其数量和质量的变化会影响GPP的评估。尽管许多光能利用率(LUE)模型考虑了散射辐射的影响,但由于不同模型计算散射辐射影响的方式差异,导致各LUE
图的anti-Ramsey数的研究是图论研究的主要课题之一,与极值图论、Ramsey理论等图论主要问题联系十分紧密.与经典的Ramsey理论不同的是,图的anti-Ramsey数的主要研究对象是彩虹图,这个问题也被看作是Ramsey理论的推广之一,并且逐渐成为图论研究的热点课题.Anti-Ramsey数是指对于给定的图G和H,使得边染色图G中不存在任何彩虹子图H的最大颜色数,它是由Erdos等人于
拒绝表达被视为一种容易破坏人际关系的语言表达。尽管迄今为止有关日语拒绝表达的相关研究已硕果颇丰,但仍存在以下不足之处。一是用于拒绝表达的研究理论仍不完善;二是职场等具体场景下的拒绝表达相关研究数量较少。本论文以宇佐美的“话语礼貌理论”为分析框架,将拒绝行为视作一个动态的、连续的过程,综合考虑对话双方使用的前置表达、动作、句中停顿等要素,并以其作为研究对象进行拒绝表达的研究。本论文选用职场电视剧台词
近年来,贸易保护主义、逆全球化、中美贸易摩擦不断蔓延,各类外部冲击使得国内不稳定、不确定因素明显增加。追溯到2014年,习总书记已经强调需要提升中国的经济韧性以防范各类风险;到2020年,新常态新背景下新冠疫情的爆发对我国经济的冲击方式从供给端转移至需求端,即中美贸易、新冠疫情等冲击造成了外部需求大量减少,此时研究出口韧性显得尤为重要。研究2008年的金融危机发现,在全球经济不景气,外部需求直线减