TD-BP强化学习算法在五子棋博弈系统中的应用

来源 :沈阳理工大学学报 | 被引量 : 0次 | 上传用户：xixicoco606

【摘要】

：

局面估值的准确性是决定棋类游戏水平高低的一个重要因素。针对使用静态估值函数的不足,提出了TD-BP强化学习算法,结合博弈中常用的极小极大搜索算法和经过历史启发增强的PVS

【作者】

：

宫瑞敏吕艳辉

【机构】

：

沈阳理工大学信息科学与工程学院

【出处】

：

沈阳理工大学学报

【发表日期】

：

2010年4期

【关键词】

：

TD算法 BP神经网络估值函数 PVS算法

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

局面估值的准确性是决定棋类游戏水平高低的一个重要因素。针对使用静态估值函数的不足,提出了TD-BP强化学习算法,结合博弈中常用的极小极大搜索算法和经过历史启发增强的PVS搜索算法,实现了一种自适应性较强的五子棋自学习程序。实验结果表明,使用该算法的程序经过较短时间的训练后达到了较好的下棋水平.

其他文献

网络时代下的高校思想政治教育创新发展研究

回回产卜爹仇贱回——回日E回。”。回祖一回“。回干肉果幻中 N_。NH lP7-ewwe--一”＄ MN。W;- __._——————》砧叫]们羽制作:陈恬’＃陈川个美食 Back to yield

会议

网络时代高校思想政治教育创新

村庄人居环境公共空间规划研究——以贵州省惠水县上马司村寨为例

实施乡村振兴战略的背景下,党和国家高度重视乡村人居环境规划。村庄的公共空间作为村民生活的主要场所,其功能重塑、科学利用等决定着村庄人居环境的改善状况。文章着眼于功

期刊

村庄人居环境公共空间空间规划

治理形式主义对策研究——以广西贺州市为例

开展党的群众路线教育实践活动，决意集中解决形式主义、官僚主义、享乐主义和奢靡之风问题。形式主义居“四风”之首，为各方所深恶痛绝。其表现形式繁多，要害是理论与实践相脱离

期刊

形式主义严重危害治理对策

油气储层地质分析与增产增储措施方法研究——评《油田开发地质学》

《油田开发地质学》一书讲述了合理开发油田开展的地质综合研究,通过有效建立油气开采与驱替系统,实现用最少的投入采出更多油气,达到提高油田采收率和经济效益的最终目标。

期刊

增产措施《油田开发地质学》地质分析

对马克思主义新闻观研究中若干问题的思考

今天,我们在新的历史条件下进行马克思主义新闻观研究。与过去时代(改革开放前,社会主义市场经济体制确立前,中华人民共和国建立前)相比,由于社会政治、经济、文化等方面的情

期刊

马克思主义新闻观研究若干问题

高校以志愿服务为载体传承中华优秀传统文化的路径研究

当代青年群体肩负建设社会主义现代化强国的时代责任，而中国优秀的传统文化是社会主义文化建设中不可忽视的一部分，高校志愿者服务工作是为弘扬中华民族传统传统文化的重要途

期刊

传统文化志愿服务传承

多元化立意个性化作文

当今社会，大干世界，异彩纷呈。以人为本、个性张扬已成时代的呼唤。在这个思想、文化多元化的时代，那种价值观、审美观一元化的作文思维模式遭到了挑战。作文能否突显个性，能否说

期刊

思维模式价值观审美观作文教学中学

提升高中生物课堂教学有效性的研究

高中生物是一门十分综合性的学科。在高中生物知识中，既有接近生活中的一部分知识，又有接近实验性的知识。这种学科特性对教师的教学能力提出很高的要求。教师在教学的过程中

期刊

生物专业素养学习方法

论simulink在高职通信教学中的宏观重要性

通信专业中通信系统是整个课程的关键,而通信系统复杂、抽象,simulink系统仿真结果清晰、明了。以2ASK信号的包络解调及相干解调为例,阐述simulink系统仿真对教学的深刻意义

期刊

通信教学simulink仿真

人类辅助生殖技术与儒家生命伦理观的价值冲突与和解

人类辅助生殖技术对人类自然出生方式和自然生命的深度干预与技术控制,使儒家传统生命伦理观遭遇伦理挑战,以致儒家生命伦理难以对人类辅助生殖技术的应用提供及时有效的价值

期刊

人类辅助生殖技术儒家生命伦理价值冲突与和解

TD-BP强化学习算法在五子棋博弈系统中的应用

与本文相关的学术论文