切换导航
文档转换
企业服务
Action
Another action
Something else here
Separated link
One more separated link
vip购买
不 限
期刊论文
硕博论文
会议论文
报 纸
英文论文
全文
主题
作者
摘要
关键词
搜索
您的位置
首页
期刊论文
基于强化学习的足球机器人协作策略研究
基于强化学习的足球机器人协作策略研究
来源 :高技术通讯 | 被引量 : 0次 | 上传用户:mmcemil
【摘 要】
:
利用强化学习方法实现足球机器人协作策略。对于不同情况,分别将零和策略及一般和策略作为强化学习的理论框架,并且借助概率增量编程进化提高系统的稳定性。
【作 者】
:
刘新宇
洪炳镕
【机 构】
:
哈尔滨工业大学计算机科学和工程系,哈尔滨工业大学计算机科学和工程系
【出 处】
:
高技术通讯
【发表日期】
:
2004年10期
【关键词】
:
强化学习
足球机器人
协作策略
编程
增量
系统
稳定性
理论框架
进化
概率
下载到本地 , 更方便阅读
下载此文
赞助VIP
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
利用强化学习方法实现足球机器人协作策略。对于不同情况,分别将零和策略及一般和策略作为强化学习的理论框架,并且借助概率增量编程进化提高系统的稳定性。
其他文献
新型六杆机构抽油机的性能分析
抽油机曲柄轴净扭矩为波动较大的交变载荷,而普通电动机的输出扭矩基本恒定不变,两者的载荷特性无法达到"和谐"的匹配,直接导致电动机热损失增高,抽油机系统效率过低、能耗增大
期刊
六杆抽油机
性能分析
优化设计
节能
six-bar pumping unit
functional analysis
optimum design
en
基因工程类丝弹性蛋白聚合物(SELP)水凝胶在药物控制释放方面的研究进展
类丝弹性蛋白聚合物(SELP)是一种通过基因工程方法合成的蛋白质嵌段共聚物,其结构由类丝蛋白(GAGAGS)和类弹性蛋白(GVGVP)的肽段单元串连重复组成。由于具有良好的生物识别性,
期刊
基因工程
类丝弹性蛋白聚合物
水凝胶
药物控制释放
生物医学材料
自主创新环境文献述评及我国省域创新环境评价
科学合理分析和评价自主创新环境,对提升国家或地方的自主创新能力具有重要的现实意义。本文在借鉴国内外相关研究文献的基础上,合理构建了我国自主创新环境评价指标体系,以2
期刊
自主创新环境
因子分析
差异性
指标体系
中国
含齿根过渡曲面的弧齿锥齿轮有限元精确建模
针对齿轮加工的展成法,建立了弧齿锥齿轮轮齿齿面展成坐标系。采用双面刀盘加工大轮齿槽的两个侧面,建立了双面刀盘的数学模型,推导了直线刀刃的切削锥面方程和刀尖圆角方程;
期刊
弧齿锥齿轮
齿根过渡曲面
工作齿面
有限元模型
spiral bevel gears
fillet
working tooth surface
finit
河南省高校青年教师心理健康现状及影响因素
目的考察河南省高校青年教师心理健康水平现状及其与工作压力、社会支持和应对方式的关系.方法采用症状自评量表(SCL-90)、大学教师工作压力量表、社会支持量表、应对方式量表
期刊
高校青年教师
心理健康
工作压力、社会支持、应对方式
学龄前儿童单纯性肥胖的危害、成因及应对策略探析
学龄前儿童时期是控制儿童肥胖的关键期和有效期。单纯性肥胖给儿童的生理发展、心理发展以及社会性发展造成了极大的危害。引起学龄前儿童单纯性肥胖的主要原因在于父母的养
期刊
学龄前儿童
单纯性肥胖
危害
成因
应对策略
Preschool children
simple obesity
hazards
causes and s
城市化水平综合测度与空间格局分析
城市化是经济社会发展的必然产物。城市化的衡量与比较已不再利用人口或土地等单一指标的方法,而是在复合指标下的人口城市化、经济城市化、社会城市化、环境和空间城市化共同
期刊
城市化水平
综合测度
结构方程模型
空间格局
基于多源数据的云贵高原湖泊水体提取方法对比研究
选取云南省内典型的高原湖泊——滇池、洱海为研究区,以TM影像、OLI影像与GF-1影像为数据源.对于TM和OLI影像,采用NDWI、MNDWI、EWI、NWI和AWEIsh指数法提取水体,结果表明五种方法均提取出水体轮廓,AWEIsh对滇池水体的提取效果最好,提取水体完整,并有效抑制了山体阴影,其总体精度为91.71%,Kappa系数为0.88;EWI与AWEIsh对洱海水体提取效果较好,水体边界
期刊
高原湖泊
TM影像
OLI影像
GF-1影像
水体提取
Plateau lake
TM image
OLI image
GF-1 image
Water
基于感知器的快速彩色图像无损压缩算法
针对彩色图像像素和颜色分量之间存在的相关性,将神经网络中的感知器技术引入彩色图像的无损压缩算法中,提出了一种新的预测模型.应用感知器的自学习和自适应能力,对预测值进
期刊
无损压缩
感知器
预测模型
相关性
彩色图像
算法
图像压缩
多媒体通信
Lossless compression
Perceptron
Predictio
基于再生核理论实现对智能机器人的轨迹跟踪控制
基于再生核理论给出了对轮动式移动机器人轨迹跟踪控制问题的一种新的解决方法。该方法不同于人们通常采用的传统类型方法,它是对有限时间内的期望轨迹进行采样,基于动力学模型
期刊
轨迹跟踪控制
智能机器人
移动机器人
核方法
有限时间
操作
曲线
再生核
期望
数值实验
与本文相关的学术论文