论文部分内容阅读
MDP是马尔科夫决策过程的英文简称。本文研究了有限阶段MDP的推广及其在投资决策过程中的应用。全文主要有四大部分构成。首先介绍了有限阶段马尔科夫决策模型,有限除段MDP费用函数非负情况下最优方程和最优策略存在条件;接下来,我们把有限阶段MDP费用函数非受可测情形推广至费用函数无界但可控情况,并给出了最优方程和最优策略存在的条件和算法。接着我们介绍了投资决策过程,依据其与马尔科夫决策中的相似性,建立金融—马尔科夫决策过程模型。本模型是在Manfred Schal在“Markov decision processes in finance and dynamic options”中所建立的模型基础上进行了改进,转移概率函数由离散函数推广至一般情况,行动空间由有限集推广至紧致集,目标函数有只有最后阶段推广所有阶段。最后,我们给出了几个应用实例,以期能够更好的说明我们所建立的模型。