【摘 要】
:
马尔科夫决策过程作为一类随机控制过程,自Bellman上世纪五十年代提出并系统研究以来,已取得丰富的理论成果和广泛的应用。最优策略的存在与求解、最优函数的确定等,是马尔科夫决策模型研究中的几个核心问题。本论文研究了一类特殊的马尔科夫决策模型,这类模型是通过状态增量的迭代来定义的。其增量由随机噪声决定,我们通过引进随机行动来控制噪声的影响。针对该模型特点,我们提出了一类新的研究思路,通过研究轨道的极
论文部分内容阅读
马尔科夫决策过程作为一类随机控制过程,自Bellman上世纪五十年代提出并系统研究以来,已取得丰富的理论成果和广泛的应用。最优策略的存在与求解、最优函数的确定等,是马尔科夫决策模型研究中的几个核心问题。本论文研究了一类特殊的马尔科夫决策模型,这类模型是通过状态增量的迭代来定义的。其增量由随机噪声决定,我们通过引进随机行动来控制噪声的影响。针对该模型特点,我们提出了一类新的研究思路,通过研究轨道的极限,结合几个具有实际背景的优化问题,讨论了求解最优策略及其最优值的方法。在研究过程中,我们证明了轨道分布在系统具备一定条件下满足大偏差原理;在系统具备更弱的方差条件时,证明了轨道分布满足大数律。同时,利用证得的轨道分布性质,提出了一类新的数值解法,来求解一类具有间断结构的微分方程。本文的主要创新点体现在:1.通过引入随机行动来控制随机迭代系统,形成一种特殊的马尔科夫决策模型;2.通过研究行动策略对极限轨道的影响来寻找最优策略;3.研究系统轨道的大偏差行为,根据大偏差速率函数来研究原模型的优化问题;4.我们采用了一种新的变换方法,证明了轨道分布在一定条件下满足大偏差原理;5.针对一类具有间断结构的微分方程,我们通过概率论方法证明了该类微分方程解的存在性,同时,提出了一种新的随机版本的欧拉法。
其他文献
研究背景:冠状动脉粥样硬化性心脏病(CHD)因为其高发病率及近年来发病呈年轻化的趋势而成为威胁我国人群健康的一种主要疾病。经皮冠状动脉介入术(PCI)作为目前治疗冠心病的主要治疗手段,其术后并发症之一是血管再狭窄。早期PCI术后再狭窄的发生率为30%~50%,虽然随着药物洗脱支架的发明,PCI术后再狭窄的发生率降至10%,但冠心病的高发病率及发病逐年年轻化趋势决定了 PCI术后血管再狭窄仍然是影响
随着城市健身圈的发展,健身成为人们塑造自己身体的实践活动,健身房成为现代人塑造完美身体的神圣空间。众多健身方式中,具有自然和谐、身心一体特质的瑜伽健身运动风靡一时。消费主义语境下的瑜伽健身不同于传统瑜伽的“神秘性”和“小众性”,呈现出“世俗化”“商品化”“健康化”的特征,吸引着越来越多的城市青年女性参与其中,这与欧美经常参与瑜伽锻炼的人群以中青年男性、女性和老人为主的特点不同。瑜伽健身为何在我国会
目 的通过回顾性研究,分析GIST患者的术前18F-FDG PET/CT显像结果与术后病理、免疫组化结果及危险度分级之间的相关性,探究术前18F-FDG PET/CT显像对GIST的危险度分级的预测价值及18F-FDG PET/CT显像对GIST临床诊疗的指导价值。材料与方法回顾性分析2011年12月至2019年7月于本PET中心行18F-FDG PET/CT显像检查,且检查后经手术完全切除肿瘤原
研究背景和目的肾透明细胞癌(clear cell renal cell carcinoma,ccRCC)是最常见的肾癌类型,约占成人恶性肿瘤的2-3%。虽然局限性ccRCC的5年生存率为65%,但转移性ccRCC的5生存率不到10%。近些年的研究发现表观遗传学调控在ccRCC的发展中起着重要的调节作用。在本研究中,我们发现microRNA-335(miR-335)和N6-腺苷酸甲基化(m6A)转移
在配电网运行的过程中发挥分布式光伏技术的作用,能够保证能源的清洁性。但是,分布式光伏技术在应用过程中也会显示一些特点,即具有很强的间歇性,且处于不稳定状态,当接入之后会对配电网运行产生影响,需要实施技术改造,以保证配电网安全可靠运行,本文着重研究了改造分布式光伏接入技术的有效方法。
云的微物理特性、光学特性以及降水的准确模拟受到诸多物理过程的影响,其中云凝结核(CCN)活化、液滴碰并、云与环境之间的夹卷(夹卷混合和夹卷率)是不确定性较大的三个过程,它们既相互独立又相互联系。本研究基于常用的WRF模式(Weather Research and Forecasting Model),对这三个过程的参数化进行了深入研究,以期提高模式对云降水的模拟能力。主要成果如下:(1)CCN活化
湿性老年性黄斑变性的病机特点在于本虚标实,肝脾肾等脏腑精气虚衰是病起之因,痰浊瘀血等实邪形成是虚证衍变的结局和加重疾病进展的诱因。回顾分析中药联合抗血管内皮生长因子治疗湿性老年黄斑变性的相关文献,从该病的病因病机、辨证治疗等进行综述。认为该病可分为脾虚湿蕴型、肝肾亏虚型、瘀血阻滞型及气阴两虚型。临床多采用抗血管内皮生长因子联合健脾化湿、补益肝肾、活血化瘀、益气养阴等中药或中成药治疗。
研究背景和目的新型冠状病毒肺炎(Coronavirus Disease 2019,COVID-19)疫情于 2019 年末在武汉爆发,其后在全世界迅速蔓延,世界卫生组织在2020年3月11日宣布新冠肺炎疫情已构成全球大流行。新型冠状病毒肺炎疫情的大流行对世界各国的医疗体系带来了巨大的负担。目前亟需设计一种能够预测感染新型冠状病毒患者病情严重程度的评分模型,用于早期从非重症COVID-19患者中识别
研究背景:胶质瘤是临床上最常见的中枢神经系统恶性肿瘤,目前的治疗以手术切除为主,由于胶质瘤广泛性浸润生长的特点,手术难以根治切除,因此,术后需联合放化疗、靶向或免疫疗法等综合治疗手段。但是,胶质母细胞瘤患者中位生存期仍仅为14.6个月,复发率和死亡率极高。随着研究的深入,大量的证据提示,胶质瘤干细胞(Glioma Stem Cells,GSCs)及其所介导的过度血管生成可能是制约胶质瘤疗效及预后的
背景和目的:急性肾损伤(AKI)是指肾脏排泄功能急剧下降,并表现为含氮代谢废物潴留和(或)尿量减少的一组临床综合征。急性肾损伤是手术患者最常见的术后并发症之一,对患者的预后有重要的影响。研究表明,术后急性肾损伤的发生与多种危险因素相关。许多学者利用急性肾损伤的相关危险因素建立了心脏手术后急性肾损伤的术前风险预测模型,但关于非心脏手术后急性肾损伤的术前风险预测模型较少。心脏肌钙蛋白I(cTnI)和氨