多元行动相关论文
在传统的MDP模型中存在着一个共同的局限性,即在决策时刻只采取单个行动来确定系统的状态转移概率.但在实际问题中,状态转移概率可能......
在传统马氏单元决策过程(MDP)模型中引入多元行动来确定系统的状态转移概率,通过运用传统MDP的基本理论以及结合多元行动集、决策向......