四国军棋智能系统定式库及开局匹配研究与实现

被引量 : 0次 | 上传用户:tongruanclassone
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人机博弈是人工智能的一个重要研究领域,其中不完全信息的人机博弈能够模拟现实复杂世界中不确定环境下的决策,因此越来越受到关注。四国军棋是一种典型的不完全信息游戏,其特点是不仅需要在对手和同盟棋子信息不确定的情况下做出决策,而且需要考虑与同盟的合作问题。目前四国军棋人机博弈研究存在的两个主要问题是:一、尽管针对四国军棋本身特点进行了搜索算法的研究,但是搜索的深度和结果,都还是难以令人满意;二、由于基础性研究还不够深入,目前没有好的评价函数。这两大瓶颈严重地影响了四国军棋人机博弈系统智能水平的高低。因此,有必要从其它方面入手对四国军棋开展研究。本文围绕四国军棋的人机博弈展开深入的研究与分析,主要工作如下:1)参考围棋的定式库技术、中国象棋和国际象棋的开局库技术和残局库技术,将定式库技术引入四国军棋的人机博弈研究。设计与实现了四国军棋的定式库以及相应的定式库开发系统,并在人机博弈系统中使用定式库技术来进行最优策略的决策。定式库技术在四国军棋博弈系统中的应用,降低了博弈系统对搜索算法的依赖,避免系统单纯依靠搜索算法而犯战略上的低级错误。2)针对棋手所用布局的倾向性和范围性,本文提出了一种基于样本的策略指导方法——开局匹配算法。该算法主要应用于开局阶段,根据开局阶段获得的少量信息,对待选的样本库进行快速地筛选,从而得到当前布局的假想布局,指导最优策略的决策。3)针对四国军棋的不完全信息特征,提出了四国军棋的蒙特卡罗算法。该算法通过单样本条件下的最优策略在整体样本条件下的模拟游戏,选出表现最好的策略作为最优策略。四国军棋的蒙特卡罗算法通过模拟游戏将不确定因素从评价函数中剥离出来,为评价函数的设计提供了新的思路。4)由于原有实验平台Nhope V1&V2版本所采用的系统框架主要侧重于博弈搜索,而且其智能模块的过程化的编程方式也使其可扩展性受到限制。定式库技术、开局匹配技术与原有的系统框架存在冲突,同时,为了增强实验平台的可扩展性,本文设计与实现了Nhope V3。Nhope V3实验平台在设计的过程中采用了面向对象的设计方法,同时注重结构设计的天然性和合理性,使得新的实验平台易于理解和扩展。
其他文献
<正>企业社会责任的下一个十年……过去的十年:企业社会责任取得了八大显著进展《WTO经济导刊》:很高兴在联合国全球契约组织成立十周年之际采访您。2000年联合国全球契约组
微电子机械系统(Micro Electro Mechanical systems,简称MEMS)是由微传感器、微执行器、控制电路、接口电路和电源等部件组成,它的发展将会对人类的科学技术、生产方式和生活
热液金矿床总是伴随着围岩蚀变,研究围岩蚀变对金矿勘查具有重要意义。总结不同类型热液金矿发现,与热液金矿密切相关的围岩蚀变主要有硅化、钾长石化、钠长石化、碳酸盐化、
箱式变电站在配电网已广泛的应用,但是在城市中心高密度区地上箱式变电站的建设有着诸多的不利因素。因此,一种新型结构的箱变—预制式埋地箱式变电站在国内外悄然兴起,2009
采用Logistic回归,分析了农村居民就医行为的影响因素。结果表明,农村医院医疗技术水平对农村居民就医行为影响最大,农村就医方便性仅次于农村医院医疗技术水平,再次是农村医
萨特提出"存在主义的人道主义"概念,强调人在社会生活中必须贯彻自由与责任的统一。萨特是在对人的自由、行动、责任、价值的理解中来定义存在主义的。一方面,他将人的气质、
本文主要介绍甲午战争(1894—1895年)前欧洲人绘制的8幅中国钓鱼岛列岛海域的地图特点,并与中国人绘制的相关地图作比较。从地名、地图在划界中的作用,以及18世纪西欧地图绘
无人机在支持舰炮对岸火力支援中,需要实时向射击指挥员提供满足精度要求的目标坐标。目前我军某型无人机采用的实时目标定位模型在复杂地形条件下存在较大原理误差,且缺乏对
时差、振幅、频率、相位差异是影响时延地震处理的主要因素。非一致性重复地震资料进行时延处理时,消除两期资料时差影响是做好后续处理工作的基础。在分析不同时期地震资料
本文就西维亚·乔迈的《疯狂约会美丽都》与《幻术师》两部影片阐释其对影院动画画面形式的独特应用。导演用造型夸张、角色鲜明的手绘直观呈现了现代工业文明进程中城市与市