基于Double-DQN的平衡类游戏改善

来源 :电子设计工程 | 被引量 : 0次 | 上传用户:tokyo55
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
现有的强化学习算法在平衡类游戏中存在过拟合与参数设置不当等问题。针对这些问题,强化学习算法应用到平衡类游戏中,不仅可以改善游戏的平衡性降低因人工测试不到位而产生的漏洞,而且可以提高游戏二次开发的可塑性。本文基于Q-learning、DeepQ-learning network、Double deep Q-learning network3种有关Q学习的强化学习算法对平衡类游戏进行实验对比,最后由测试结果得出结论:Double Deep Q-learning network强化学习算法解决了过拟合与参数设置
其他文献
<正>2014年6月3日,中国国际招标网版主汪才华转载国家发展改革委员会"《关于整合建立统一规范的公共资源交易平台的方案》征求社会意见"的主题帖,将发改委"根据《国务院办公
移情是从他人的角度去感受、理解他人的感情,是分享他人的感情,而不是表达自我的情感。简言之,是从对方的角度来观察世界。在社会发展、法制健全的今天,患者的自我保护意识不断地
目的:应用颈椎三维有限元模型,探讨颈椎"椎骨错缝"对颈椎病患者关节和椎间盘应力的影响。方法:选取颈椎病患者,通过颈椎动静态触诊和X线判定发生"椎骨错缝"的患者1例(男,28岁
在我国,随着市场经济的进一步发展,知识经济、数字革命、网络时代的到来不断冲击着我国的本土经济。在新一轮的市场浪潮中,传统商业经济如何才能面对新兴经济的挑战,要从二者
<正>对于简单案件,海关可以当场制发行政处罚决定书。《中华人民共和国海关办理行政处罚简单案件程序规定》(以下简称"《规定》")自2010年4月1日起施行。简单案件办理程序是
创业意向作为影响创业成功的重要因素,一直是学者的重要研究议题。情绪智力作为影响大学生学业及创业成功的重要因素也越来越受到学者的关注。本研究目的在于探讨情绪智力对创
针对开挖技术在地下管道铺设及修复施工中的诸多不利因素,文章在介绍了几种常见的非开挖技术施工的基础上,重点结合实际工程案例,对非开挖施工中的顶管作业在排水管道铺设及
基金市场是我国资本市场的重要组成部分,而证券投资基金则是我国资本市场中最为重要的机构投资者。揭示基金行业所存在的问题并采取措施予以有效的解决不仅关系到该行业未来
近年来,随着电视媒体行业竞争的日益激烈,电视新闻节目在叙事上的多元化倾向愈加明显。央视新闻频道的《新闻周刊》节目创办十余年来,始终坚持改革创新,适应时代发展。目前,央视《
新城市主义从城市设计角度,通过社区活力更新力图抑制城市蔓延。近些年,我国滥用新城市主义理论、机械照搬国外经验的现象屡见不鲜。本文在系统梳理新城市主义根源与精神内涵