爱恩斯坦棋计算机博弈算法的研究与实施

来源 :重庆理工大学 | 被引量 : 0次 | 上传用户:kalagou
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
计算机博弈,也称机器博弈,是人工智能领域极具挑战的一个分支。计算机博弈的研究,最早追溯到20世纪50年代阿兰图灵所设计的第一个纸上象棋程序。经过近七十年的研究,全球计算机博弈领域的专家、学者们为计算机博弈贡献比较丰富的理论、实战案例分析,包括相关的技术、方法与策略,特别是国际象棋、围棋等棋类计算机博弈,取得了令人惊讶的成果。比如,1997年国际象棋棋王卡斯帕罗夫对战IBM深蓝、2016年世界围棋九段李世石对战谷歌AlphaGo,均以人类棋手失败而告终,藉此人们对计算机博弈有了崭新认识,真正认识到计算机博弈领域,人工智能的强大。相比国外的精彩,国内计算机博弈的研究起步较晚,但也发展迅速,比如,从2006年首届全国性计算机博弈竞标赛开始,迄今已经成功举办11届比赛,近年来每年参加决赛的师生有300多支队伍、400余名师生,角逐17个项目,参加高校近40所,这些活动极大推动了我国计算机博弈活动的发展。本论文选择了不完全信息博弈、并非大家喜闻常见的爱恩斯坦计算机博弈为研究对象,爱恩斯坦棋具有多变的初始对局状态和在行棋过程中需要通过掷骰子决定具体走子范围的特点,这既提高了博弈过程的趣味性,也增加了博弈决策的研究难度。论文引入计算机博弈领域的著名UCT(Upper Confidence Bound Apply to Tree)算法,提出改进思想及其实施方法,在此基础上构建新的博弈策略系统,以提升棋力。为此,全文首先阐述了计算机博弈基本原理以及相关技术;其次,介绍了爱恩斯坦棋规则并建立了数学模型;然后,比较深入分析了UCT算法,构建应用策略;最后,开发了爱恩斯坦棋博弈系统,参加全国比赛,验证成果。论文在以下方面开展细小的创新工作:(1)确立攻守平衡基本策略。比较详细分析了爱恩斯坦棋特征并建立数学模型,从攻守结合和削减掷骰子所带来决策影响力角度,与调节进攻因子、防守因子和保护因子为手段,优化了估值方法,构建了二次估值函数,极大提高了爱恩斯坦棋计算机博弈中的估值准确性。(2)建立混合优化算法。提出了基于随机模拟的蒙特卡洛算法和基于预测的期望搜索算法相结合的混合优化算法(Hybrid Optimization Algorithm),并将二次估值函数应用到混合优化算法之中,提高了机器学习方法蒙特卡洛的模拟搜索过程与运行效率。(3)提出提速与全局优化着法方法。基于现在PC机强大的多核计算能力,引入并行计算方法,提高了UCT算法运行速度;引入当前估值因子(WINK)和次优节点平衡因子(UCTK),以决策估值方法部分克服了博弈着法优选难题,促使博弈全局性最优着法的产生。论文作者携带上述研究成果武装的KnighTeam-AN2程序跟随计算机博弈团队参加了2016年在沈阳航天航空大学和2017年在重庆互联网学院、重庆理工大学举办的2届全国比赛,均取得全国冠军。这直接证明了论文研究成果的可行性与有效性。
其他文献
介绍了职业安全健康管理体系的基本原理和方法,论述了地勘单位在实施职业安全健康管理体系过程中的具体做法及取得的成效。
土体固结度是真空预压法加固土体效果的一个重要评价指标,地基最大沉降量的计算是确定土体固结度的关键。本文结合工程实例,分析了GM(1,1)灰色模型在真空预压沉降预测中的可行
鄂西、鄂西北和陕西汉中地区,处于南水北调中线工程的水源区,同时也是我国黄姜产业最密集的地区,因此黄姜在加工生产过程中产生的大量污水势必会影响调水工程的供水安全.笔者
在多级模糊评价的基础上,结合高速公路运营期具体情况,提出了与之相适应的二级模糊综合评价法.并以沪宁高速公路为例,对其环境质量进行了综合评价。同时提出了相应的环境保护
由农药在非饱和土壤中运移的一维弥散方程简化,得出衰减因子--AF参数模型,评价了应用范围广、用量大、毒性高的7种农药对地下水污染的潜能,顺序为:乐果>甲胺磷>甲草胺>丁草胺>敌
合成了壳聚糖和丙烯酰胺改性壳聚糖两种高分子混凝剂,并以NaF溶液为研究对象,考察了两种壳聚糖混凝剂投加量、pH值、接触时间及温度对除氟性能的影响。实验结果表明:丙烯酰胺
本文通过对仪器的改装和检测CO2的测试条件的优化,确定了真空法和吹扫法相结合的进样方式,进行了最小进气量的试验,确定了气相色谱法定量管进样测定小体积气体中CO2最佳分析
采用3种不同的富营养化评价方法,以西安市为例,对城市景观水体富营养化状况进行评价。总成分分析营养度评价法是通过对各单因子的分营养度进行算术平均,将水体营养状态连续分级;
建立了吹扫捕集-气质谱联用仪同时测定地表水中22种挥发性有机物的方法。NIST标准谱库检索定性,外标法定量。各组分得到了较好的分离,在0.5~1000g/L浓度范围内线性关系良好,标准曲