论文部分内容阅读
<正> 以期望总报酬为准则的连续时间马氏决策规划,自R.A.Bellman(1957),特别是Miller研究以来,已有一些文献报道。这些文献,就我们所知,都是从微分方程型的最优方程出发,给出一个策略是最优的充要条件。这种条件是不便于验证的。本文对更广的模型,给出了一个策略是最优的新的充要条件(定理4和5),该条件颇为直观;并进一步探讨了最优