切换导航
文档转换
企业服务
Action
Another action
Something else here
Separated link
One more separated link
vip购买
不 限
期刊论文
硕博论文
会议论文
报 纸
英文论文
全文
主题
作者
摘要
关键词
搜索
您的位置
首页
期刊论文
强化学习中基于定性模型的知识传递方法
强化学习中基于定性模型的知识传递方法
来源 :计算机工程与科学 | 被引量 : 0次 | 上传用户:liongliong442
【摘 要】
:
本文提出一种基于定性模糊网络的强化学习知识传递方法。该方法通过建立系统的定性模型,并用定性模糊网络抽取基于定性动作的次优策略的共同特征获得与系统参数无关知识。这
【作 者】
:
黄晗文
郑宇
【机 构】
:
湖南大学计算机与通信学院,湖南工业职业技术学院信息工程系,北京交通大学计算机与信息技术学院
【出 处】
:
计算机工程与科学
【发表日期】
:
2011年6期
【关键词】
:
强化学习
定性模型
知识传递
reinforcement learning
qualitative model
knowledge transfer
下载到本地 , 更方便阅读
下载此文
赞助VIP
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文提出一种基于定性模糊网络的强化学习知识传递方法。该方法通过建立系统的定性模型,并用定性模糊网络抽取基于定性动作的次优策略的共同特征获得与系统参数无关知识。这些知识能有效描述参数值不同的系统所具有的共同控制规律,加快在新参数值的系统中强化学习的收敛速度。
其他文献
早期油料火灾图像检测及识别技术研究
本文提出了一种早期油料火灾图像检测及识别算法。将火焰颜色、亮度及运动特征作为火灾检测与识别的判据,在火焰颜色模型和运动图像差分模型的基础上提出利用离散分形布朗随机增量场模型对早期油料火灾图像进行进一步的判定。模拟坑道实验结果表明,该算法能够有效提高油料火灾检测与识别的准确率,降低误报、漏报率。
期刊
油料火灾图像
火焰模型
差分模型
离散分形布朗随机增量场模型
oil fire image
flame model
differential model
dis
基于Event—B的SpaceOS2操作系统任务管理需求形式化建模与验证
随着中国航天技术的发展,航天器系统的软件规模越来越大、复杂度越来越高,对航天软件的正确性、可靠性、安全性等提出了更为严格的要求.形式化方法是提高软件可信性的一个重
期刊
任务管理
形式化模型
形式化验证
Event—B
task management
formal model
formal verification
Eve
关爱地震灾区破损家庭重组与心灵重建
家庭是社会构成的基本单位,对实现个人社会价值、维护社会稳定起着极其重要的作用。"5.12"汶川特大地震造成四川灾区近万个家庭破损,这些破损家庭的发展走向直接关乎社会和谐
期刊
DHT网络中并发下载及安全防御机制的实现
本文对并发下载技术进行了研究,并在此基础上实现了基于Chord算法的并发下载机制。现在,大多数结构化P2P网络都构建于基于DHT的覆盖式网络之上。文中分析了DHT算法的基本原理、
期刊
P2P网络
DHT
并发下载
恶意节点
peer-to-peer network
distributed hash table
concurrent dow
其他学术论文