论文部分内容阅读
随着信息技术和计算机技术的飞速发展,人工智能技术在金融贸易、医药、诊断、重工业、运输、远程通讯、在线和电话服务、法律服务、科学发现、玩具和游戏、音乐等诸多方面得以迅速发展。其中,能够像人一样进行思考、动作,是拟人行为模式学习的最终目标,对于人工智能的表现起着至关重要的作用游戏一直是测试人工智能能力、训练人工智能能力的不二选择,在某些领域,人工智能的水平已经超越人类选手。过去的几年中,AlphaGo先后战胜李世石、柯洁,成为第一个击败人类职业围棋选手、第一个战胜围棋世界冠军的人工智能程序。作为人工智能领域的重要应用之一,在游戏中引入人工智能技术,对于研究有着重要的推动作用。作为人工智能的典型技术,近年来多智能体技术在智能机器人、交通控制、柔性制造、协调专家系统等方面有着广泛应用,通过引入多智能体融合决策等技术,利用博弈论等方法,可以通过对不同场景的智能的态势分析和对策演化,获得最佳的决策效果。日本麻将作为在东亚地区流行的博弈游戏,有着完善的规则与平台和激烈的对抗性,对人工智能的决策要求较高。本文在分析并研究多智能体的基础上,选择以日本麻将为研究对象,对多智能体博弈行为进行研究,并提出了多智能体决策融合的方法。这一方法可以有效提高智能体的决策准确性,首先,本文介绍了博弈论与多智能体的基本理论,博弈论研究具有斗争或竞争性质现象的数学理论和方法。博弈论研究的对象是游戏中的单个目标的预测将会做出的行为和实际的行动,并给出优化的方案。多智能体系统由数个智能体的集合构成,其特点是能够将单个繁复的系统拆分成彼此协调且便于维护的系统。其次,在对日本麻将的游戏规则解读的基础上,将其建模为四人不完全信息下的非合作博弈问题,对分阶段的决策模型和智能体的实际策略进行了建模和计算机程序实现,并提出一种基于递归树搜索的日本麻将自动出牌的算法,具有多个不同策略的智能体模型,每个智能体模拟人类玩家进行游戏的一种策略。最后,将不同的智能体在日本麻将的标准化平台“天凤”上进行测试,通过分项剖析和统计分析,验证了不同策略的优劣性,之后提出了决策融合方法,对不同的智能体的决策进行融合,对融合后的新智能体进行测试,比较其与单一智能体的性能,最终形成完整的游戏辅助决策软件。结果证明,本文方法能够有效提高多智能体合作的性能。