不确定规划中带权值的强规划算法研究

来源 :湘潭大学 | 被引量 : 0次 | 上传用户:benlums
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于模型检测的方法因其能够解决很多现实世界中的不确定规划问题,已成为研究不确定规划的主要方法之一。当使用基于模型检测的方法来对不确定规划问题进行求解时,可以得到三种不同类型的解:弱规划解、强循环规划解、强规划解;其中,执行强规划解能够确保不确定转移系统在有限的步长内从初始状态到达目标状态,在一些要求绝对满足安全的规划中,强规划解是唯一满足要求的解,而在实际应用中,执行规划动作需要耗费一定的时间、金钱等,这些代价可以用动作权值来表示,所以研究动作权值之和最小的强规划解是很有意义的。本文主要研究了完全可观察条件下单agent带权值的不确定规划问题和完全可观察条件下多agent带权值的不确定规划问题。针对完全可观察下单agent带权值的不确定规划问题,目前已有对最小权值强规划解的研究,但算法的效率欠佳,有必要继续研究新的方法,进一步提高求解的效率。本文通过引入基于模型检测的强规划分层法,对系统进行分层,然后利用得到的分层信息,能够快速排除那些无强规划解的情况;当存在强规划解时,设计了一种利用分层信息反向搜索最小权值的算法,该算法通过动态确定搜索上界和搜索下界的策略,避免了许多无用的搜索。通过对实验数据的分析可知,本文的算法能够较快的求出最小权值强规划解,且效率高于已有的直接搜索的算法。目前,对不确定规划问题的研究主要是针对单agent的,而对于多agent的研究则侧重于确定规划。针对这一现状,本文首次提出了完全可观察下多agent带权值的不确定规划问题,并设计了使所求解的强规划解所需的动作权值总和近似最小的算法SPSMNPW。在算法SPSMNPW中,先利用基于模型检测的强规划分层方法对每个agent进行强规划分层,然后利用规划问题中agent的初始状态集合等信息来合并所有agent的分层信息,并在合并的过程中得到同层状态之间的冲突表,再使用正向搜索方法,在保证冲突最小的情况下,以最小动作权值优先的贪心方法,求出强规划解。通过对实验结果的分析可知,本文所设计的算法能够较快的求解出使所选择的动作权值总和近似最小的强规划解。
其他文献
基于粗糙集理论的信息系统是Pawlak提出的,该理论的一些应用,如规则提取、不确定决策、分类与特征提取等都与信息系统有关.信息系统的约简是信息系统研究的一个重要问题,另一
随机Loewner演变(简称SLE)是一类含有一个参数的随机平面增长过程,它可以通过解驱动函数为一个时间改变的一维Brownian运动的Lowner微分方程来描述。这个过程与渗流丛的尺度
随机Loewner演变(简称SLE或SLE_κ)是通过解驱动函数为时间改变的布朗运动的Loewner微分方程来描述的一类带有一个参数κ的共形不变随机分形曲线族.对SLE_κ的研究,从上半平
近年来,矩阵特征值反问题在结构设计、参数识别、自动控制、量子力学、光谱分析等领域有广泛的应用背景,因此关于特征值反问题的研究已成数值代数热点课题。随着四元数应用范
教学模式是幼儿园教育教学活动正常开展的重要组成部分,能够有效地促进教育者从整体上综合地探讨教学过程的本质与规律。当前,幼儿园科学领域的教学活动虽已渐渐形成较为广泛认可的教学流程,但仍缺乏固定的、已形成一定理论的幼儿科学教育教学模式,以至幼儿园科学教育活动忽视幼儿探索性,或探索只是停于表面,缺乏一定的体系和深度的现象仍时有发生。4c教学模式作为由乐高教育引入的一种固定的教学模式,已有部分学者进行了一
学位
精细积分算法由于其计算速度快、数值结果精度高等优点,在常微分方程、控制理论等相关领域得到了广泛应用。但是,当常微分方程的系数矩阵较大时,其计算速度优势并不明显。因
随着信息时代的到来,大量的图片、视频等高维信息逐渐渗透到人们日常生活中,这些高维信息急需我们有效处理,虽然大量的科研工作者已经在这方面取得了一定的成果,但是还存在相
辨识组织特异性蛋白质相互作用(PPI)网络中关键蛋白质及功能模块对理解生物体的内在活动机制、具有针对性的疾病诊断和药物设计具有重要作用。识别蛋白质及功能模块需要高可
本文主要讨论了以下两类分数微分方程边值问题,第一类为其中CD0+α是Caputo分数阶导数,a∈(n- 1,n], n≥3, n ∈ N, 0 < β < 1, 0< η
随着数值模式的不断发展,模式本身存在的不确定性问题受到越来越多的关注。利用多参数化方案进行集合预报的方式可以有效地降低由模式不确定性带来的误差。超级集合技术根据