【摘 要】
:
基于行为的移动机器人通过传感器输入和执行器输出信号的方法相互作用,产生各种“刺激-应激"行为,从而使得机器人能够利用简单的结构在变化的,无组织的环境中产生快速响应,实
论文部分内容阅读
基于行为的移动机器人通过传感器输入和执行器输出信号的方法相互作用,产生各种“刺激-应激"行为,从而使得机器人能够利用简单的结构在变化的,无组织的环境中产生快速响应,实时性好。然而,基于行为的机器人的学习过程实际上是设计过程中的学习,而不是机器人自主运行后拥有的学习能力。由于动态环境的复杂性和不可预知性,这种没有记忆,内部表达环境和学习能力的机器人不能随着环境的变化而变化,从而缺乏对环境的适应性。 为了增强移动机器人在动态环境中的学习和适应能力,本文创新性地提出了一种新的基于改进Elman神经网络的具有学习和记忆功能的机器人行为控制器,利用Elman神经网络特有的联接方式,使得系统不仅对当前输入的信息敏感,并且对历史输入具有敏感性,提高了系统处理动态信息的能力,加强了系统对动态环境的适应性。 由于基于梯度下降BP算法的研究目前己较为成熟,所以Elman神经网络权值的训练通常采用动态BP学习算法。但是由于BP算法收敛速度慢,容易陷入局部最小等缺点,本文引入遗传算法来改进权值的训练,构建了进化BP算法来训练神经网络,提高了机器人行为的准确性和快速性。 在设计机器人行为时,机器人所需执行的任务和即将面临的环境都是未知的,因此要求移动机器人必须具有根据环境和任务的改变,修改自身某些动作行为的能力,即具有自学习的能力。因而本文采用无教师的在线强化式学习方法控制机器人行为,设计了基于Sarsa-强化学习算法的机器人避障和漫步行为的仿真试验,使得机器人的动作和行为能够符合外部环境和任务的要求。
其他文献
本论文主要依托“十五”国家科技攻关计划课题“基础交通信息采集与融合技术研究”和深圳市交通警察局课题“深圳市智能交通系统总体发展研究”。论文围绕城市道路交通信息提
文章阐述了我国证券市场投机行为特征和过度投机的表现,探析了我国证券市场过度投机的原因,论证了过度投机的根源在于我国证券市场的特殊结构。文章通过深入分析发现,在我国
传统的高职高专英语听力教学忽视了文化背景知识的传授,影响了听力教学的效果。学生如不熟悉英语国家文化就会在听力理解过程中无法有效地理解听力内容。教师应利用各种教学
沅江市位于湖南省北部,濒临洞庭湖滨。市内方言有三支:沅江话、赤山话和南大话。本文调查及研究的对象主要是沅江话(属湘方言、)。文章全面、详细地描写和概括出沅江话的语音
随着国内经济的快速增长及人民生活水平的日益提高,社会对供电可靠性的要求也越来越高。如何提高供电可靠性,减少企业和居民的停电次数和时间,已成为各电网运行单位的一件大事。
采用硬脂酸、钛酸酯、十二烷基苯磺酸钠、磷酸酯及其不同配比对CaCO3进行表面改性处理。通过对改性效果分析,讨论各改性剂的改性特点及最佳配比,寻找碳酸钙的改性最佳工艺。
在此从大学英语教学有效载体的理论依据和现实意义出发,详细阐述英文歌曲和英文电影对大学英语教学的积极辅佐作用,并进一步探讨其在实际大学英语教学中的具体运用。
介绍了一种以冷媒为介质的液化天然气(LNG)冷能利用系统(简称冷媒系统)。该系统先利用冷媒在接收站内同LNG换热回收冷能,再将携带冷能的冷媒输送到接收站外供给冷能用户使用
将模拟灌溉制度的ISAREG模型与灌水方式相结合研究辣椒常规沟灌和隔沟灌条件下的灌溉制度。对不同灌水方式条件下灌溉制度模拟所需的各项参数进行了预处理和验证,分析评价了
再制造是通过必要的拆卸、检修和零部件更换等,将废旧产品恢复得如同新的一样的过程,适用于汽车、计算机、打印机、复印机、手机、电视机、冰箱、空调器、洗衣机、轮胎、印刷电