切换导航
文档转换
企业服务
Action
Another action
Something else here
Separated link
One more separated link
vip购买
不 限
期刊论文
硕博论文
会议论文
报 纸
英文论文
全文
主题
作者
摘要
关键词
搜索
您的位置
首页
期刊论文
新的启发式Q学习算法
新的启发式Q学习算法
来源 :计算机工程 | 被引量 : 0次 | 上传用户:baimeng1111
【摘 要】
:
针对连续型强化学习问题,提出一种综合启发函数和评估函数的Q学习算法,利用启发函数加快学习速度,采用评估函数减少不必要的探索,提高学习效率。为了保证该算法的有效性,启发
【作 者】
:
王洪彦
【机 构】
:
沈阳航空工业学院计算机学院
【出 处】
:
计算机工程
【发表日期】
:
2009年22期
【关键词】
:
Q学习
启发函数
评估函数
网络游戏
Q-learning
heuristic function
evaluation function
online g
【基金项目】
:
辽宁省自然科学基金资助项目“基于P2P的MMOG关键技术的研究”(20052007),辽宁省教育厅攻关计划基金资助项目“网络游戏引擎及其相关技术的研究”(2004D116)
下载到本地 , 更方便阅读
下载此文
赞助VIP
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对连续型强化学习问题,提出一种综合启发函数和评估函数的Q学习算法,利用启发函数加快学习速度,采用评估函数减少不必要的探索,提高学习效率。为了保证该算法的有效性,启发函数和评估函数根据Q函数进行计算。坦克大战游戏的仿真实验结果证明,该方法可以较大地提高Q学习的学习效率。
其他文献
基于量子模型的快速FPGA布局算法
为能在全局范围内快速搜索到优化的布局结果,提出一种基于量子模型的布局算法,并结合传统模拟退火算法实现FPGA布局。测试结果表明,相比VPR布局算法,该算法的布局运行速度平均提
期刊
现场可编程门阵列
布局算法
量子模型
模拟退火算法
Field Programmable Gate Array(FPGA)
placement algorit
M*(k)-index构造算法的改进
一些基于图结构的索引技术通过缩小查询范围提高对XML数据的查询速度,但存在分隔不相关节点的问题。该文改进M*(k)-index的构造算法,用单一的M**(k)-index结构取代原算法的序列结构,以
期刊
XML数据
索引结构
M*(k)
-index结构
XML data
index structure
M*(k)-index structure
基于尺度相乘的Canny改进算法
在Canny算法框架下,对图像进行多尺度滤波分析。定义尺度乘积函数为2个不同尺度滤波器的响应乘积,由相邻尺度近似性确定乘积后的幅值和相角,再选择阈值剔除伪边缘,由非极大值抑制得到图像边缘。实验结果表明,算法比传统Canny算子在噪声抑制和边缘定位方面具有更优的性能。
期刊
边缘检测
尺度相乘
CANNY算法
edge detection
scale multiplication
Canny algorithm
疲劳状态监控系统中眼睛状态检测方法
针对眼睛状态检测在实际疲劳监控系统应用中的缺陷,在定位眉毛和眼睛区域的前提下,结合图像处理、复杂度、混合投影和眼睛的几何特征,提出一种快速的眼睛状态检测方法。给出具体检测步骤和主要算法实现。实验结果表明,该算法可用于不同背景、旋转和偏转角度等多种复杂条件下的眼睛检测,通用性好,处理速度快,并解决了偏光和戴深色边框眼镜的情况。
期刊
复杂度
混合投影
几何特征
complexity
combined projection
geometry feature
其他学术论文