论文部分内容阅读
不确定规划是目前人工智能研究领域的一个热点。在完全可观察性的条件下对扩展目标作规划,以及在完全可观察性(或部分可观察性)的条件下对可达性目标求强规划解(简称强解)是其中的两个重要的不确定规划问题。
在完全可观察性的条件下对扩展目标作规划时,扩展目标常常体现为时态逻辑公式,特别是CTL公式或E<,A>G<,LE>公式。虽然E<,A>G<,LE>与CTL相比具有可以表示“规划意图”和“对子目标的失败处理机制”的特点;但是,在表示扩展目标的语义层次上,有关CTL和E<,A>G<,LE>之间比较的研究还不多。本文根据有关CTL目标公式和E<,A>G<,LE>目标公式的严格的语义描述,证明了:对于许多E<,A>G<,LE>目标公式而言,都存在着一个与之语义等价的CTL目公式(在这些E<,A>G<,LE>目标公式当中,还包括了一些原来被认为不可以用CTL目标公式表达的E<,A>G<,LE>目标公式)。另外,本文还分析指出了E<,A>G<,LE>目标公式与CTL目标公式相比在表达能力上的一些局限性。
在目前所有的关于求强规划解(无论是在完全可观察性还是部分可观察性的条件下)的研究中,观测变量的集合都被认为是固定的而且是强制性的。然而,在许多现实的规划领域里,观测变量的集合是变化的或者是可选择的:另外,某些观测信息对强解的执行也许是毫无用处的,但获得这些观测信息却需要付出一定的代价。为强解作观溅信息约简(即在不影响柑应盼动作执行过程的情况下,尽量简化伴随其间信息观测工作)是一个很有意义的研究内容,因为它可以改善强解的质量并使其执行的代价减少。就我目前所知,这仍然是个待解决的问题。本文首次提出了相关问题,并给出了第一个对状态——动作表形式的强解作观测信息约简的算法sTRONG-FO-PO。输入某个状态——动作表形式的强解π<,F>,算法STRONG-FO-PO会首先计算一个近似最小的在π<,F>执行期间可能有用的观测变量集V<,obs>,然后把π<,F>F转化为一个建立在V<,obs>上的条件规划π<,F>。另外,本文还证明了该算法是可终止的和合理的。