Efficient reinforcement learning in continuous state and action spaces with Dyna and policy approxim

来源 :城市道桥与防洪 | 被引量 : 0次 | 上传用户:zjgzhufu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
该文从挂篮荷载计算、施工流程、支座及临时固结施工、挂篮安装及试验、合拢段施工、模板制作安装、钢筋安装、混凝土的浇筑及养生、测量监控等方面人手,介绍了S226海滨大桥主桥连续预应力混凝土变截面箱梁2#~7#块、8#、8
其他文献
期刊
针对考虑舵机特性的船舶航向离散不确定非线性系统,提出一种自适应神经网络输出反馈控制设计方法。首先,构造等价的考虑舵机特性的船舶航向离散非线性不确定输出反馈系统;然后,仅
期刊
Objective:The purpose of this study is to demonstrate the decomposition and removal effects of dextranase-containing toothpaste on dental plaque. Method:In the
该文从挂篮荷载计算、施工流程、支座及临时固结施工、挂篮安装及试验、合拢段施工、模板制作安装、钢筋安装、混凝土的浇筑及养生、测量监控等方面人手,介绍了S226海滨大桥
人的自由全面发展是马克思对人类理想社会——共产主义社会本质特征的重要概括,是马克思主义的终极目标和最高理想,也是马克思主义理论的出发点和归宿点。马克思认为人的发展和
本文报告用长春新碱、柔毛霉素和强的松诱导缓解,用氨甲喋呤+6-巯基嘌呤或单用氨甲喋呤维持缓解的联合用药治疗方案,共治疗急性白血病227例。药物和剂量: 诱导缓解:长春新碱
对于民主这个问题的争论之声,自民主诞生以来就一直没有停止过。民主是现代社会的一种重要价值,因此对于民主的反思也成了哲学百花园中的一道亮丽的风景线,而哈贝马斯的商谈民主
波兰尼(MichaelPolanyi,1891-1976),匈裔英籍著名物理化学家和哲学家,他从自然科学研究出发,进而上升到“层级本体论”的最后一个序列,即“人”本身上来,由此波兰尼克服了实证主义
期刊