切换导航
文档转换
企业服务
Action
Another action
Something else here
Separated link
One more separated link
vip购买
不 限
期刊论文
硕博论文
会议论文
报 纸
英文论文
全文
主题
作者
摘要
关键词
搜索
您的位置
首页
期刊论文
强化学习中的时间差分法在用户学习方面的应用
强化学习中的时间差分法在用户学习方面的应用
来源 :计算机工程 | 被引量 : 0次 | 上传用户:cuisong521
【摘 要】
:
随着Internet上信息量的与日俱增,用户查找自己感兴趣的信息变得越来越困难.文章提出了一种使用强化学习中的时问差算法来学习用户的新学习算法,并通过实验与其它学习方法作
【作 者】
:
陈俊杰
张必勇
宋瀚涛
陆玉昌
余雪丽
【机 构】
:
北京理工大学计算机系,太原理工大学计算机系,北京理工大学计算机系,清华大学计算机系
【出 处】
:
计算机工程
【发表日期】
:
2004年4期
【关键词】
:
强化学习
时间差分法
用户Agent
用户模型
向量表示
Reinforcement learning
Temporal Difference method
【基金项目】
:
国家重点基础研究发展计划(973计划),山西省自然科学基金,教育部科学技术研究项目
下载到本地 , 更方便阅读
下载此文
赞助VIP
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着Internet上信息量的与日俱增,用户查找自己感兴趣的信息变得越来越困难.文章提出了一种使用强化学习中的时问差算法来学习用户的新学习算法,并通过实验与其它学习方法作了比较,取得了明显的成效.
其他文献
其他学术论文