受控排队系统相关论文
本文共分为六章. 第一章为综述,简要介绍了马尔可夫决策过程的历史背景,连续时间马尔可夫决策过程、离散时间马尔可夫决策过程和受......
连续时间马尔可夫决策过程在很多领域有着广泛的应用,其中,平均报酬(费用)准则是最常用的准则之一,因为它被广泛应用于电信与排队......
根据连续时间马尔可夫决策过程的平均准则,给出了一种特殊的马尔可夫决策过程一受控排队系统平均最优以及约束最优的新条件.这个新条......