用于图像游戏的深度强化学习改进算法研究

来源 :青岛科技大学 | 被引量 : 0次 | 上传用户:ct32845359
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
将深度学习算法融入到强化学习的游戏图像处理中是适宜的做法,也使得对图像游戏的研究更加深入。然而运用深度强化学习算法来处理图像游戏也是渐进发展的。最开始的算法是运用强化学习的马尔科夫决策过程与Q学习算法并与深度学习的卷积神经网络,还有随机经验重放算法共同构成了深度Q学习随机经验重放算法。后来又演化出了深度Q学习优先经验重放算法,即把一些认为重要的重放单元更多的拿出来进行学习而减少那些不重要的重放单元学习的机率。现在可以通过改进算法实现比之前的算法更优的效果。根据算法分析,一部分经验比其它经验要对参数的训练产生更大的作用。之前的算法还不能很好的满足智能体学习图像游戏获得高成绩的要求。本文提出了一种改进深度Q学习优先经验重放算法,通过改变优先级到概率的映射函数,并对比之前算法的单一映射函数,最后找到了将重要的优先重放单元更高概率的进行重放学习的映射函数,使智能体能够学习到最优的游戏策略并有效提升游戏成绩。在实验中首先进行改进算法的直观模型策略分析,然后进行各算法CNN网络层数架构的选择,代价函数分析,效率分析以及各算法的游戏分数对比。最后通过测试结果可以证明了本文中的新算法可以使智能体在图像游戏中更加有效的决策从而实现赢得更高得分同时花费更少时间的目标。
其他文献
以临岳高速洞庭湖大桥为例,研究STC桥面铺装层对大跨径悬索桥整体性能的影响,对比分析不同的铺装方案、不同的铺装厚度下桥梁的静动力性能.结果表明:STC桥面铺装层能够有效提
<正>一旦关节受损,在运动中就容易出现反复受伤,比如膝关节。为了防止膝盖骨受损,建议可以采取站桩的办法以增强股四头肌和膝盖骨的功能。姿势:两脚平行分开与肩同宽,全身自
期刊
一为了查一张照片的日期,我翻阅旧日记.1998年7月5日这天的一篇日记,留住了我沉思.时探亲去美国,住在洛杉矶我大孙女家.这天的日记写道:
【正】今年“两会”期间,胡锦涛总书记在参加湖南代表团审议时,着重强调要“积极改善民生,促进社会和谐”,并再次强调要做好就业和社会保障工作,继续实施积极的就业政
现代科学技术和传统知识相结合获得知识产权保护,是历史悠久、传统知识资源丰富的发展中国家在知识经济竞争中可能有的优势。我国具有丰富的传统医药知识,如果能够在专利制度
析阿拉伯语主动名词姚维新“主动名词是从动词演变来的一种派生名词。” ̄①动词基本上都可以派生出主动名词,成为阿语词汇中的一个重要组成部分。主动名词作为名词的一种,与汉语
"丝绸之路经济带"战略的提出加强了各国之间日益频繁的经济文化交流,需要更多具备跨文化交际能力的国际化人才,对高校培养大学生的语言及跨文化交际能力提出了更高的要求。本
2019年全国法院民商事审判工作会议纪要出台后,我国关于"对赌协议"司法裁判的重心便从起初的效力性问题转向了协议的履行可能性,审视规范也更多地集中于公司法的组织性强制规