不确定SMDP基于全局优化的鲁棒决策问题

来源 :系统仿真学报 | 被引量 : 7次 | 上传用户:guoqy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
考虑半马尔可夫决策过程(SMDP)在一些系统参数不确定,且性能函数依赖于这些参数时的鲁棒决策问题。这些参数的不确定性不仅导致等价无穷小生成子的不确定性,也导致性能函数的不确定性。论文针对相关参数的情况,分别采用不同的全局优化算法,即填充函数法和模拟退火算法,进行鲁棒控制策略求解。仿真实例说明,全局优化方法的使用保证了平均准则和折扣准则下的计算结果之间当折扣因子趋近于零时的极限关系成立。
其他文献
摘 要:随着研究生教育规模的迅速扩大,单个导师培养一定数量的研究生越来越显得力不从心,而导师组制培养也存在形式化的重要障碍。针对单一导师制和导师组制的优缺点,笔者认为在实际培养过程中分阶段将二者结合起来才是研究生培养的最佳选择。其主要分为两大阶段,第一阶段是在学生入学之初至论文选题确定之前,以导师组制为其培养方式;第二阶段是学生在确定论文选题后至完成论文答辩,这一时段实行单一导师制和导师组制相结合
作者简介:陈兴义(1966-),男,山西运城人,党员,副教授,兰州石化职业技术学院学生处处长。  史晓庆(1982-),女,陕西宝鸡人,硕士研究生,高教管理研究实习员,兰州石化职业技术学院石油化学工程系辅导员。  周亮(1981-),男,安徽砀山人,硕士研究生,讲师,兰州石化职业技术学院信息处理与控制工程系教师。  李鹏(1981-),男,陕西人,工程师,中石油第二建设公司苏丹项目部项目经理,研究
痛风是一组嘌呤代谢紊乱所致的疾病,其临床特点为高尿酸血症引起的急性关节炎发作,痛风石沉积,慢性关节炎和关节畸形以及间质性肾炎和肾结石。目前尚无特效的中西治疗药物。笔者
混沌优化算法采用的是串行优化结构,采用并行结构进行,并不断缩小搜索空间,提高了混沌优化在变量取值范围较大情况下的搜索效率。针对混沌在全局最优点附近搜索速度变得很慢、精度较低的缺点,结合单纯形法,提高了收敛的速度和求解精度。仿真结果表明并行混合优化算法可以得到满意的结果。
摘 要:感恩是中华民族的美德,是当代大学生必须具备的人格素养。当下高校家庭经济困难学生的感恩意识淡薄甚至缺失,加强高校的感恩教育势在必行。本文通过对目前受助困难生感恩意识缺失的成因分析,从认知教育、情感教育、情感教育、环境渲染及制度建设五个层面提出了较为系统的感恩教育方案。  关键词:高校;家庭经济困难学生;感恩教育  中图分类号:G641文献标志码:A文章编号:2095-9214(2016)09
作者简介:邵艳(1977-),女,汉族,江苏徐州人,副教授,硕士,研究方向:体育教育训练学,江苏工程职业技术学院体军部。  摘要:相比于其他院校,高职院校培育出来的新式人才更能适应现今的岗位竞争,表现出独特的实践优势。高职学员在毕业后,将要从事一线的岗位生产,因而客观上需要学员具备优良的体魄。从体育教学来看,需要培育学员的职业能力,只有这样才能符合新课改的总体需要[1]。对此,有必要探析高职体育在
针对三维复杂工程施工仿真,提出了一种基于UML技术的仿真方法。对仿真的全过程,包括仿真系统分析、模型设计、工程流程设计、三维仿真实现、仿真结果的评估、仿真的修改维护等进行管理。最后结合一个实际的复杂工程做了一个仿真实例,证明提出仿真方法的高效性。
国家食品药品监督管理局制定的GSP管理实施细则为药品经营企业提供了很好的质量管理教材,作为药品流通领域的经营企业不该把国家对企业的监管及认证工作当作一个负担,药品经营
针对系统部分非线性未知的直流电机的位置跟踪问题,提出了一种基于自适应控制的神经网络滑模控制策略,在这个控制策略里我们采用已有的输入输出线性化方法来消除非线性,且将神经网络的输出加入到控制器当中,仿真结果演示了变负载直流电机的位置输出能够跟踪任意给定曲线。
根据合作机器人(Cobot)与人合作的特点,对其不完全约束关节机构和虚拟轨迹控制两项关键技术进行了建模及仿真研究.建立了基于双超越离合器的不完全约束关节机构的模型,对该机