具有认知能力的智能机器人行为学习方法研究

被引量 : 0次 | 上传用户:DrunkenLion
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
行为学习是智能机器人设计中的关键技术之一。目前,机器人行为学习方法只限于学习反射式行为。人为给出任务的知识表示结构,根据训练样本来不断调整参数,一旦任务改变则需要重新编程。具有该行为学习能力的系统不具备认知能力,无法产生复杂的智能行为。研究具有认知能力的机器人系统已经成为机器人学研究的重要方向,研究涉及认知心理学、认知科学以及动物行为学等领域。本文着重研究了机器人的认知机制,深入分析了认知模型对于机器人智能发展的重要性。提出了具有认知能力的智能机器人体系结构,并对认知模型中的知识表示以及学习方法进行深入研究,最后利用该研究成果实现了环境的空间认知,自底向上突现出了多任务规划行为。论文的主要工作如下:首先,本文从智能产生的角度重新对机器人的范式进行分类。新的范式分类不仅涵盖了传统的系统范式,而且完善了智能机器人的认知层次,区分了不同的智能等级,明确了认知能力在机器人系统范式中的地位。在此基础上,本文提出了具有认知能力的智能机器人体系结构。该体系结构具有自主学习的能力,只需要给出基本的反射式行为,所有的高级认知能力都可以通过自主学习得到,不需重新编程。各模块之间互相依赖并且可以同时学习,具有实时的学习能力。其次,研究了环境特征的自组织提取,利用“主动感知行为”和“感知-运动协调”来获得环境特征。给出基于变化检测和激活强度的活性神经元设计方法,并利用动态增长自组织特征图(GDSOM)实现了路标的自组织提取和路标识别。实验表明该路标提取和识别方法无需精确定位控制和传感器度量模型,具有较好的鲁棒性和计算速度,并且有效解决了“感知变化性”问题,为认知能力打下基础。再次,研究了时空经验的知识表示和学习方法。讨论了认知数学模型——观测驱动马尔科夫决策过程(ODMDP)并提出了相应的求解策略。借鉴生物神经元的特性,提出一种新的生物神经网络模型—时空联想记忆网络(STAMN)。该网络实现了状态和行动的增量学习并且解决了ODMDP的状态定位问题。利用STAMN实现了环境的空间认知,实验表明该网络可以用于解决循环环境的同时全局定位和标图(SLAM)问题。最后,研究了具有认知能力的强化学习方法。针对机器人所面临的多任务学习问题,提出了具有认知能力的强化学习模型,并提出了适合多任务学习的k步记忆和k步预测的Sarsa((k-M)(k-P) Sarsa)算法。该强化学习模型解决了ODMDP的策略学习问题,并且具有较好的收敛速度。迷宫环境实验验证了智能机器人的多任务学习的有效性。
其他文献
随着名为《活着》的中国失独老人调查视频的播出,失独家庭的境况正在被越来越多的人所知悉。失独老人不仅面临着养老、医疗等方面的困境,更面临着难以走出的精神困境。因此,
自70年代开始,文化途径翻译研究的重点不断地转移,在不同的文化语境中形成了各具特色的研究模式。它包括源起于以色列的多元系统论,图里以及低地国家学者所推动的描述翻译研
结合工程实际,介绍了国网河南省电力公司省—市—县一体化高清视频会议组网规划和实现过程。详细介绍了高清视频MCU设备、网络设备和传输设备级联的具体方法,阐述了OSPF和BFD
大学生核心价值观的基本内涵可以概括为坚定信仰、学以报国、崇尚真理、明荣知辱等四方面内容。我国正处在社会转型期,社会存在发生了巨大变化,导致人们的生存方式日趋多样化
<正>乌梅饼方出自《本草纲目》,由乌梅肉、生蜜糖混合捣成饼状,敷贴患处,治恶肉。笔者用以治疗伤口肉芽肿,收效显著,兹举验案2则如下。例1:陈××,男,56岁,农民。左膝关节内
期刊
高尔基说:“书籍是人类进步的阶梯。”人类文明与读书有密切的关系。本研究主要通过对初中生阅读习惯现状的调查和访谈,发现当今中学生在阅读观、读书渠道、时间管理、环境需
1985年,我国开始实行出口退税政策。出口退税政策的目的在于提高出口货物国际竞争力、优化出口产品结构、促进外贸出口持续发展。本文从出口退税政策运行、出口退税机制、管
财务指标是为了反映企业财务状态和业绩绩效而设计的,是财务状况和业绩的信息载体。目前,我国财务指标体系存在一定局限,并不能全面反映企业的财务状况和业绩。本文从指标内
近年来频繁的地质灾害暴露了我国应急通信策略严重落后的问题。本作品提出了一种基于短波通信的无中心自组网的方案,可以在常规通信网络瘫痪后迅速建立无线网络节点,实现跨越