Autonomic discovery of subgoals in hierarchical reinforcement learning

来源 :The Journal of China Universities of Posts and Telecommunica | 被引量 : 0次 | 上传用户:shenkefang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Option is a promising method to discover the hierarchical structure in reinforcement learning(RL) for learning acceleration. The key to option discovery is about how an agent can find useful subgoals autonomically among the passing trails. By analyzing
其他文献
针对利用稀疏角度投影数据实现优质CT图像重建的问题,提出了一种改进的基于选择性图像全变差(TV)约束的快速迭代重建算法。该算法采用两相式重建策略,首先利用代数重建算法(ART)重建中间图像并进行非负性约束,然后采用选择性TV最小化对上述图像进行优化修正,两步交替进行直到满足某一收敛准则。为了进一步提升算法效能,该算法在迭代过程中应用快速收敛技术加快算法收敛。应用该算法对仿真的Sheep-Logan
期刊
通过教学改革的不断深化,传统的教学方式已经不能满足国家发展对于高素质人才的要求。本文介绍了office办公软件在教学过程中的应用,并且分析了这种新型的教学方式对提高学生学习效率、培养学生创新能力的影响。
期刊