Deep reinforcement learning:a survey

来源 :信息与电子工程前沿(英文版) | 被引量 : 0次 | 上传用户:xiaoxiaohaizi319
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Deep reinforcement learning (RL) has become one of the most popular topics in artificial intelligence research. It has been widely used in various fields, such as end-to-end control, robotic control, recommendation systems, and natural language dialogue systems. In this survey, we systematically categorize the deep RL algorithms and applications, and provide a detailed review over existing deep RL algorithms by dividing them into model-based methods, model-free methods, and advanced RL methods. We thoroughly analyze the advances including exploration, inverse RL, and transfer RL. Finally, we outline the current representative applications, and analyze four open problems for future research.
其他文献
  管道设计中需要按照标准或规定对管道进行分析以保证管道能够安全运行;结合管道应力分析经验,对涉及石油天然气行业管道应力分析的AsME系列准则和国内输油输气管道设计标准
当年用老式胶片机拍的照片有些模糊不清了。  照片把齐抗美在援藏期间的无数快乐记录了下来:脸被高原的阳光晒得黝黑,站在西藏工业电力厅门口微笑着后面的大楼则是他工作了三年的地方。  还有一张在基层电站调研的照片,高原阳光强烈,齐抗美脸上像镀了层明亮的阳光,藏族职工正用瓷碗向他敬着青稞酒。  如今,齐抗美已是中国电力投资集团公司党群工作部主任。  打开抽屉,他拿出一个文件夹,里面保存着他在担任西藏自治区
近日,盘锦日报高级记者、盘锦市黑嘴鸥保护协会会长刘德天在4月22日(地球日)参加了第三届“绿色中国年度焦点人物”颁奖盛典后载誉归来。 Recently, a top reporter of Panj
  针对输气处常用的分离除尘设备从气源点气质情况、排污量,除尘效率等方面对其进行普查后找出其中存在的问题,并针对有从单井进气的输气站场分离除尘器的选择,存在问题的分离
改善合肥市饮用水质措施的探讨合肥市卫生防疫站(230061)江志勤,姚佐南巢湖水是合肥市居民主要饮用水源之一,近10多年来由于工业废水及城市生活污水的大量排入,湖水受到严重污染,水体总磷年
抓住机遇 巩固爱婴医院成果索朗次仁,珠杰西藏自治区山南地区妇幼保健院856000山南地区妇幼保健院认真贯彻促进母乳喂养成功十点措施,在创建爱婴医院基础上,不断巩固和完善已取得的工
除四害是城市爱国卫生运动的主要任务之一,也是全国卫生城市评比的必备条件。其主要任务是采取科学有效的方法将“四害”控制在不足危害的水平,保障人民的身体健康, In add
We study a mobile edge computing system assisted by multiple unmanned aerial vehicles (UAVs), where the UAVs act as edge servers to provide computing services f
  埋地管道与通行道路交叉的情况较为普遍,其安全问题也日益受到重视。研究埋地油气管道在重车碾压下的受力情况的分析计算方法。通过有限元仿真计算了典型情况下的管道的应
  球罐作为储存和运输气、液态物料的存储容器,有着极其苛刘的工作环境,所存储的介质具有易燃、易爆、腐蚀、高压等特点,一旦发生事故后果严峻。危险与可操作性分析方法以其系
会议