基于神经网络的强化学习在避障中的应用

来源 :清华大学学报(自然科学版) | 被引量 : 0次 | 上传用户:dage10
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为了提高移动机器人的自学习能力,在基于行为控制结构的基础上设计了智能控制结构,该结构引入了强化学习模块。神经网络具有很好的泛化能力,该文提出了基于神经网络的强化Q学习算法,克服了表格式Q学习算法只能应用到离散的状态中并需要大量存储空间的不足,最后结合智能控制结构应用到移动机器人的避障中。实验结果表明,该方法能够使移动机器人通过自学习实现自主避障。 In order to improve the self-learning ability of mobile robot, an intelligent control structure is designed based on the behavior control structure, which introduces the reinforcement learning module. The neural network has a good generalization ability. In this paper, an improved Q learning algorithm based on neural network is proposed, which overcomes the shortcoming that the tabular Q learning algorithm can only be applied to discrete states and requires a large amount of storage space. Finally, The structure is applied to obstacle avoidance of mobile robot. Experimental results show that the proposed method can make mobile robots realize autonomous obstacle avoidance through self-learning.
其他文献
丘东平的小说不是非战小说,但是具有"非战性"。"非战"不是单纯地反对战争和英雄主义,而是在重新考量爱国主义、民族主义的基础上,通过个体的战争体验寻找人类共通的对生存与
高校校园文创产品作为高校校园文化的载体,是高校与高校、高校与社会之间的文化交流之间的载体,随着时代的发展,科技与电子产品使用的频繁使用化,校园文创产品的销售不再是单纯的
分析了视频数据的3D小波系数分布特性,提出了一种基于混合3D树型结构和HVS特性的视频可分级编码算法。首先,依据小波低、高频系数的自相关性,确定相应的树型结构来扫描和处理时间维上的低、高频系数,明显减少了用于定位重要系数的同步信息;其次,依据人类视觉系统对各频率子带敏感程度的不同,对各子带系数进行加权,使得重构视频的重要系数得以排在码流前端,从而在很大程度上提高了中低码率下视频的重构质量。对多种标
活性炭具有较强的吸氡能力,利用该特性可实现局部空间降氡的目的。本文研究了活性炭局部降氡实际应用中最大降氡效率与活性炭吸附系数、活性炭质量、空间体积、环境温度及湿
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清华大学发明人:隋森芳文摘:本发明属于生物技
目的探讨预后营养指数(prognostic nutritional index,PNI)与脑梗塞患者预后的关系。方法回顾性分析150例脑梗塞患者临床资料,搜集性别、年龄、白蛋白、淋巴细胞计数等基本资
关于婚姻,林语堂曾有过一个比喻:婚姻是饭。有饭,才是踏实的。  林语堂家境清寒。廖翠凤慕林语堂已久,廖母却有异议,廖翠风说:“贫穷算不了什么。”这话传到林语堂耳朵里,让他很感动。1919年,25岁的林语堂与24岁的廖翠凤喜结良缘。结婚当天,林语堂拿过婚书对妻子说:“我把它烧了,婚书只在离婚时有用,我们一定用不到。”烛火点燃了婚书,红红的火苗证明着林语堂要和妻子白头偕老的决心。  林语堂是经营婚姻的
两会是大事,我倒留意了几则“小新闻”。  四荤四素,没有酒水,没有高档菜……简单的自助餐成为各个代表团的用餐新标准。吃多少取多少,“光盘行动”也进了人民大会堂;大幅减少会议简报、大会发言报告等纸质印刷品,主要通过委员办公系统平台及官方网站发布。仅此“无纸化”办公一项,可节省会议支出约200万元。  事情其实都很小,小到一顿饭、一张纸、一瓶水。由此传递出的信息,却相当厚重。这是一种自上而下、从中央到
目的探讨乙型脑炎发病规律和临床特征,为乙脑防制提供科学依据。方法对开江县1985~2005年临床诊治的乙脑患者306例进行流行病学个案调查及分析,取2002~2005年乙脑病人血清,采用反
从社会学角度分析广场舞事件深层次的社会诱因。指出了广场舞参与者属于社会弱势群体,缺乏舆论话语权;没有形成正规的体育组织;体育公共服务总量供给不足;职能部门缺位;社会