一种记忆可修剪型仿生机器人的速度跟踪算法研究

来源 :现代电子技术 | 被引量 : 0次 | 上传用户:llllgy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对强化学习算法训练网络规模较大、运行时间较长、过度拟合等问题,提出一种记忆可修剪型强化学习仿生模型(H-RLM)作为两轮机器人的学习机制。该算法将神经网络输出与期望输出的最小均方差作为代价函数,采用Hessian矩阵和Markov相结合的决策进行寻优,选择最大评价值对应的最优行为。这样既可以保证初期网络学习训练内容的完整性,又降低了系统对初始条件的约束性,提高了控制算法的泛化能力。利用H-RLM和强化算法对两轮机器人进行速度跟踪实验,结果表明,H-RLM算法能够提高网络学习效率、消除延迟影响、减小输出误
其他文献
随着航空电子系统的迅速发展,系统间频繁的信息交换和共享对数据传输实时性和可靠性的要求日益提高。针对这一要求,提出了一种基于CPCI系统下实现AFDX协议端系统接口功能的方
随着硬盘价格的下跌,移动硬盘已经成为了许多电脑用户的随身装备。不过有很多朋友,都是购买的硬盘盒与笔记本硬盘(以下简称硬盘)自己DIY——这种移动硬盘虽然价格便宜,但是与品牌移动硬盘相比却在抗震性上稍有不足。    合理避震,让硬盘不怕“空难”    在“解剖”过多款入门级的品牌移动硬盘后,笔者发现这些产品大多采用在硬盘与硬盘盒之间增加填充物的方法来进行避震。这就意味着只要动动手,就完全可以打造自己
传统数字功率因数校正器要使用三路ADC采样,特别是电感电流的采样会造成电路效率的下降以及复杂度的上升。研制一台基于Boost电路的数字功率因数校正器,控制回路只使用了一路AD
基础化学课程是我校所有一年级新生的一门重要的必修课,而目前的入校新生的化学基础各不相同,其中,一些学生的高中化学基础非常薄弱。在基础化学教学过程中,这类学生往往容易
文中分析了"海澄文"经济圈物流企业空间布局存在的问题,揭示影响"海澄文"经济圈物流企业空间分布的主要影响因素,提出优化"海澄文"经济圈物流企业空间布局的对策建议。一方面
通过对基因图谱的有效检测获得遗传基因信息,根据这些信息实现对病理的分析和诊疗。传统的基于图谱检测方法采用基因序列测定方法获得图谱的像素特征信息,随着个人基因信息在区域间的像素分类特征的增大,导致检测结果不准。提出一种基于区域像素分类的基因图谱检测方法。通过对基因图谱检测系统原理的分析,利用荧光物质的闪烁现象记录基因图谱的核糖核酸辐射值,包括基因图谱的光导和光电倍增量值,通过区域像素分类,形成电子束
在北斗导航系统建成以前,我国的船舶定位主要依靠GPS导航系统。北斗系统的全球覆盖,不仅打破了GPS的垄断,也为我国的船舶定位提供了另一,种更加安全和精确的导航定位途径。本
目的对6个厂家的地西泮注射液进行肌肉刺激实验及溶血性实验,以评价其临床用药的安全性。方法采用家兔进行肌肉刺激实验,14只家兔分为7组,每组2只,即6个不同厂家的样品组及1
针对安徽省电力系统EPON网络的特点及电力系统现有光缆监测技术特点,提出一种"OTDR+光开关+合波器+光反射器(终端过滤器)"光缆在线监测系统设计方案。EPON光缆在线监测系统能够实时监测光缆线路的性能变化,及时发现故障隐患,迅速定位障碍点,有效减少故障的历时,从而降低因温度和应力等因素带来的电力系统光纤通信网的故障发生。