一种改进的自动分层算法BMAXQ

来源 :计算机工程与应用 | 被引量 : 0次 | 上传用户:wujun
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对MAXQ算法存在的弊端,提出一种改进的分层学习算法BMAXQ。该方法修改了MAXQ的抽象机制,利用BP神经网络的特点,使得Agent能够自动发现子任务,实现各分层的并行学习,适应动态环境下的学习任务。
其他文献
<正> 乔治·萨顿(George Sarton,1884—1956)是本世纪最著名的科学史家。他是科学史作为一门独立学科的奠基人和创建者,是科学史学会的发起人和组织者。早在1912年他就创办了
<正>本刊讯(特约通讯员柏斌)日前,国家苹果产业技术体系云南(昭通)综合试验站病虫草害综合防控技术培训暨2010年任务落实会在昆明召开。受百年不遇的冬春持续干旱影响,云南苹
作为一个坚定的马克思主义者,伊格尔顿面对21世纪这一全新时代景观所出现的诸多问题,通过聚焦伦理学研究,试图回应当下"左派如何思考与行动"这一严峻问题。伊格尔顿的伦理学
法国对知识产权有较为完善的保护体系,编纂了知识产权领域首个专门法典《法国知识产权法典》,在专利代理行业也形成了培训、实习、资格考试等一系列制度。文章介绍了法国专利
通过对废水中COD进行测定,研究并结合具体实验,对重铬酸盐法测定COD中的一些细节问题进行了补充和说明,同时对该方法影响因素进行分析以及对如何消除这些因素予以说明,使得重
育肥猪适时出栏应考虑到屠宰率、肉质品质和经济成本3个因素。猪的生长发育规律是:前期增重慢,中期增重快,后期增重又变慢。据有关介绍,猪体重在10.0-67.5kg阶段,日增重随体重的增加
开设副班主任之职由来以久,但是副班主任往往都是抱着事不关己、高高挂起的心态,对班主任的工作实行不闻、不问、不管的"三不"政策,与全员管理班级的教育理念相悖。最终又抱
中亚位于丝绸之路中段,是中国、中亚、草原、印度和波斯等文化的汇合处。通过研究我国西北部和中亚各地出土的丝织品、毛织物、黄金制品和铜镜等精美工艺制品的造型和纹饰,可以