论文部分内容阅读
泛在机器人技术将机器人的传感和执行组件广泛分布在环境中,通过协调分布式的组件基于网络互相协作来完成任务。这一技术用环境智能来弥补当下服务机器人智能技术的不足,具有低成本、易于扩展、高复用性、高效率、高鲁棒性等优势。在泛在机器人技术中,如何协同不同的组件完成任务,以优化时间和资源耗费是一个很重要的问题。而泛在机器人非确定性、非平稳性和高维度的特点,使得任务规划问题更为困难了。针对这几个问题,本文在经典规划模型和马尔可夫决策过程模型的基础上提出了精简马尔可夫决策过程模型,以满足非确定性表达能力并降低模型复杂度。在此基础上,设计和实现了求解此模型的规划算法。针对传统算法由于缺乏先验知识而收敛速度慢的问题,本文提出了先确定化松弛规划问题,然后利用启发函数初始化加速的算法。针对非平稳性特点,提出了在线自适应模型动态修正算法。针对高维度特点,提出了基于变量依赖关系的自动分层方法和基于半马尔可夫决策过程理论的分层求解算法。为了验证算法的有效性,本文设计和开发了基于组件化技术的泛在机器人系统框架,在实际系统中搭建了泛在机器人测试平台,本文的工作主要包含以下几个方面:(1)针对泛在机器人系统的高维度和非确定性特点,对规划问题进行建模研究。提出了任务规划的精简马尔可夫决策过程模型,这种模型既能满足泛在机器人任务规划问题中不确定性特点的要求,又有效降低了状态转移的分支系数,使其能够应对大规模的问题。(2)为了提高规划效率,首先松弛精简马尔可夫决策过程模型为确定化模型,用启发函数进行迭代初始化,在不同规模的问题上结合不同的迭代更新算法作了测试。针对实际问题的非平稳性特点,在线学习组件执行任务的状态转移概率,使得系统能够适应环境变化,修正模型错误。(3)提出了基于变量依赖关系的层次行为寻因抽象算法(HOCA),主要过程是先从变量的依赖关系计算变量依赖关系图,并根据变量依赖关系图将状态空间划分成拓扑层次结构;然后在每一层次中将动作或已经抽象得到的行为抽象成更高阶的行为,从抽象的行为中生成子目标,并导出子问题;最后基于半马尔可夫决策过程理论求解每一层中的子问题,并将原问题转化成半马尔可夫决策过程问题进行求解。另外,本文从算法的收敛性、完备性和最优性三个方面进行了理论证明和实验分析,证明了算法的收敛性、有限制的完备性和分层最优性。本文通过大量的实验对算法进行了验证和对比。(4)设计和开发了基于组件化技术的泛在机器人系统构架,基于此构架搭建了机器人酒吧和智能装配生产线两个实验平台。面向复杂环境,对泛在机器人任务规划技术进行了实际的测试。在实际实验平台上结合了本文提出的几种算法,并进行了详细的讨论和分析。从理论分析和实验结果来看,本文提出的模型和方法能够适用于泛在机器人任务规划问题,并且针对泛在机器人任务规划的非确定性、非平稳性和大规模的特点,提高了规划效率,优化了规划结果。具有一定的实用价值。