具有认知能力的智能机器人行为学习方法研究

被引量 : 0次 | 上传用户：DrunkenLion

【摘要】

：

行为学习是智能机器人设计中的关键技术之一。目前,机器人行为学习方法只限于学习反射式行为。人为给出任务的知识表示结构,根据训练样本来不断调整参数,一旦任务改变则需要

【作者】

：

王作为

【发表日期】

：

2010年期

【关键词】

：

认知模型 ODMDP 时空联想记忆网络 SLAM (k-M)(k-P) Sarsa算法

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

行为学习是智能机器人设计中的关键技术之一。目前,机器人行为学习方法只限于学习反射式行为。人为给出任务的知识表示结构,根据训练样本来不断调整参数,一旦任务改变则需要重新编程。具有该行为学习能力的系统不具备认知能力,无法产生复杂的智能行为。研究具有认知能力的机器人系统已经成为机器人学研究的重要方向,研究涉及认知心理学、认知科学以及动物行为学等领域。本文着重研究了机器人的认知机制,深入分析了认知模型对于机器人智能发展的重要性。提出了具有认知能力的智能机器人体系结构,并对认知模型中的知识表示以及学习方法进行深入研究,最后利用该研究成果实现了环境的空间认知,自底向上突现出了多任务规划行为。论文的主要工作如下:首先,本文从智能产生的角度重新对机器人的范式进行分类。新的范式分类不仅涵盖了传统的系统范式,而且完善了智能机器人的认知层次,区分了不同的智能等级,明确了认知能力在机器人系统范式中的地位。在此基础上,本文提出了具有认知能力的智能机器人体系结构。该体系结构具有自主学习的能力,只需要给出基本的反射式行为,所有的高级认知能力都可以通过自主学习得到,不需重新编程。各模块之间互相依赖并且可以同时学习,具有实时的学习能力。其次,研究了环境特征的自组织提取,利用“主动感知行为”和“感知-运动协调”来获得环境特征。给出基于变化检测和激活强度的活性神经元设计方法,并利用动态增长自组织特征图(GDSOM)实现了路标的自组织提取和路标识别。实验表明该路标提取和识别方法无需精确定位控制和传感器度量模型,具有较好的鲁棒性和计算速度,并且有效解决了“感知变化性”问题,为认知能力打下基础。再次,研究了时空经验的知识表示和学习方法。讨论了认知数学模型——观测驱动马尔科夫决策过程(ODMDP)并提出了相应的求解策略。借鉴生物神经元的特性,提出一种新的生物神经网络模型—时空联想记忆网络(STAMN)。该网络实现了状态和行动的增量学习并且解决了ODMDP的状态定位问题。利用STAMN实现了环境的空间认知,实验表明该网络可以用于解决循环环境的同时全局定位和标图(SLAM)问题。最后,研究了具有认知能力的强化学习方法。针对机器人所面临的多任务学习问题,提出了具有认知能力的强化学习模型,并提出了适合多任务学习的k步记忆和k步预测的Sarsa((k-M)(k-P) Sarsa)算法。该强化学习模型解决了ODMDP的策略学习问题,并且具有较好的收敛速度。迷宫环境实验验证了智能机器人的多任务学习的有效性。

其他文献

浅析城镇地区失独老人的精神困境和精神自养

随着名为《活着》的中国失独老人调查视频的播出,失独家庭的境况正在被越来越多的人所知悉。失独老人不仅面临着养老、医疗等方面的困境,更面临着难以走出的精神困境。因此,

期刊

失独老人精神困境精神寄托老无所依家庭破碎精神自养信仰宗教自我价值再婚

文化途径翻译研究：争议与回应

自70年代开始,文化途径翻译研究的重点不断地转移,在不同的文化语境中形成了各具特色的研究模式。它包括源起于以色列的多元系统论,图里以及低地国家学者所推动的描述翻译研

学位

翻译研究文化途径翻译研究语言学途径翻译研究翻译观念翻译研究学科翻译研究文化转向翻译研究方法

基于OSPF和BFD的河南电力高清视频会议规划

结合工程实际,介绍了国网河南省电力公司省—市—县一体化高清视频会议组网规划和实现过程。详细介绍了高清视频MCU设备、网络设备和传输设备级联的具体方法,阐述了OSPF和BFD

期刊

高清视频会议OSPFBFD三级级联自动切换

单味中药对肺心病肺动脉高压治疗的研究进展

期刊

肺动脉高压汉防己甲素肺心病单味中药

大学生核心价值观教育研究

大学生核心价值观的基本内涵可以概括为坚定信仰、学以报国、崇尚真理、明荣知辱等四方面内容。我国正处在社会转型期,社会存在发生了巨大变化,导致人们的生存方式日趋多样化

学位

大学生核心价值观社会主义核心价值体系思想政治教育

乌梅饼敷贴治伤口肉芽肿验案2则

<正>乌梅饼方出自《本草纲目》,由乌梅肉、生蜜糖混合捣成饼状,敷贴患处,治恶肉。笔者用以治疗伤口肉芽肿,收效显著,兹举验案2则如下。例1:陈××,男,56岁,农民。左膝关节内

期刊

肉芽肿

初中生阅读习惯状况调查

高尔基说:“书籍是人类进步的阶梯。”人类文明与读书有密切的关系。本研究主要通过对初中生阅读习惯现状的调查和访谈,发现当今中学生在阅读观、读书渠道、时间管理、环境需

学位

初中生阅读阅读习惯

浅谈我国出口退税政策

1985年,我国开始实行出口退税政策。出口退税政策的目的在于提高出口货物国际竞争力、优化出口产品结构、促进外贸出口持续发展。本文从出口退税政策运行、出口退税机制、管

期刊

出口退税出口退税政策出口退税机制

浅析现行财务指标体系的局限及改进

财务指标是为了反映企业财务状态和业绩绩效而设计的,是财务状况和业绩的信息载体。目前,我国财务指标体系存在一定局限,并不能全面反映企业的财务状况和业绩。本文从指标内

会议

财务指标指标改进经济内涵

基于短波自组网的应急通信系统

近年来频繁的地质灾害暴露了我国应急通信策略严重落后的问题。本作品提出了一种基于短波通信的无中心自组网的方案,可以在常规通信网络瘫痪后迅速建立无线网络节点,实现跨越

学位

应急通信自组网短波通信地理信息系统

具有认知能力的智能机器人行为学习方法研究

其他学术论文