切换导航
文档转换
企业服务
Action
Another action
Something else here
Separated link
One more separated link
vip购买
不 限
期刊论文
硕博论文
会议论文
报 纸
英文论文
全文
主题
作者
摘要
关键词
搜索
序列累计奖赏相关论文
面向深度强化学习的样本生成与选择方法的研究
深度强化学习是人工智能领域用于处理序贯决策问题的重要研究分支,其根据智能体与环境的交互过程中所产生的样本来学习最优策略。......
学位
深度强化学习
样本效率
序列累计奖赏
经验回放单元
遗传算法
基于平均序列累计奖赏的自适应ε-greedy策略
探索与利用的权衡是强化学习的挑战之一。探索使智能体为进一步改进策略而采取新的动作,而利用使智能体采用历史经验中的信息以最......
期刊
深度强化学习
探索与利用
序列累计奖赏
-greedy策略
看过本文同时还关注
如何写好一篇毕业论文
免费论文查重的方法
从零开始写毕业论文的方法
热心助人的动物
第一届全国脊柱脊髓基础研究及临床...
2004世界科技七大看点
对甘肃省国有企业兼并问题的思考
热心助人的动物
对甘肃省国有企业兼并问题的思考
热心助人的动物