论文部分内容阅读
机器博弈目前是人工智能的一个重要研究领域,成为验证了人工智能各项成果的良好平台。非完美信息博弈作为机器博弈中的一个重要分支,相比于对手信息透明的完美信息博弈,更接近现实复杂世界中不确定环境下的决策,具有更深层次的研究价值。军棋是在中国广泛流行的棋盘类游戏,属于典型的非完美信息博弈问题,对其进行研究具有很强的实际意义。本文针对非完美信息博弈和军棋本身特点,对于其中的招法生成、搜索算法、概率推断三个问题进行了研究。同时基于以上研究结果,设计了军棋博弈系统,具有接近人类的智能水平。针对招法生成问题:结合军棋的棋盘特点和行棋规则,本文提出快速招法生成器来代替传统穷举搜索棋盘的办法。提出了基于公路、铁路、工兵三种快速招法生成器,将当前可能出现的棋盘局面进行二进制数编码,之前进行预处理,在招法生成中可以搜索局面想匹配的二进制数,快速给出招法。同时给出实验对比,来验证快速招法器的有效性。针对搜索问题问题:将传统运用在完美信息信息博弈中的UCT算法进行改进,结合其原理和非完美信息博弈的特点提出了确定性融合UCT算法。对于这种算法的概念、流程、数据结构给出介绍,同时将这种搜索算法应用到军棋中,最后对该算法给出了理论与实验的证明。针对概率推断问题:由于军棋这类非完美信息博弈中对手棋子类型的不可见性,如何建立一个好的概率模型准确地推理出对手的状态成为一个重要研究问题。为此提出了非完美信息概率推断模型,将传统用于图像学的马尔科夫网络模型和快速招法预测算法相结合,完成对于当前棋盘局面的推断。同时,将非完美信息概率推断模型应用到军棋中,给出实验验证模型的可行性。最后总结了以上三种针对军棋这类非完美信息博弈问题的改进方法,设计并实现军棋博弈系统。详细介绍了军棋博弈系统中主要构成模块及它们之间的逻辑关系,同时给出了大量的实验结果,证明了改进算法的有效性。