【摘 要】
:
机器博弈是人工智能领域的重要研究方向。非完备信息博弈是机器博弈的子领域。非完备信息博弈中存在隐藏信息和信息不对称的特点,和完备信息博弈相比,非完备信息博弈更加贴近
论文部分内容阅读
机器博弈是人工智能领域的重要研究方向。非完备信息博弈是机器博弈的子领域。非完备信息博弈中存在隐藏信息和信息不对称的特点,和完备信息博弈相比,非完备信息博弈更加贴近现实生活中。例如,竞标、拍卖、股票交易等现实问题中都存在隐藏信息和信息不对称。因此,研究非完备信息博弈问题更有现实意义。德州扑克博弈包含了隐藏信息、信息不对称和随机事件等重要特性,它是典型的非完备信息博弈。求解德州扑克博弈的传统方法是基于抽象的求解方法,该方法结合状态空间抽象和虚拟遗憾值最小化算法(Counterfactual Regret Minimi-zation,CFR)离线求解扑克博弈策略,无法进行博弈策略的实时求解。本文以德州扑克为研究对象,结合残局策略求解方法和启发式博弈树搜索方法来研究二人非限制性德州扑克博弈策略的实时求解算法。针对扑克博弈的局部策略求解问题,研究博弈问题的分解方法和博弈残局的求解方法。借鉴完备信息博弈问题的分解思路,把非完备信息博弈问题的博弈树分解为主干和一系列游戏残局,同时把完备信息博弈中的残局概念推广到非完备信息博弈中。针对非完备信息博弈问题的博弈残局,研究残局构造算法,使得博弈残局符合扩展式博弈的定义,并使用CFR及其改进算法求解博弈问题的局部策略。针对扑克博弈策略求解的时效性问题,研究启发式博弈树搜索算法和博弈残局估值算法。为提升基于博弈树搜索的求解算法的运行效率,使用博弈残局估值来限制搜索深度,使用动作抽象方法来搜索广度。同时,针对德州扑克博弈,给出了从扑克残局训练数据生成、扑克残局训练数据编码到扑克博弈训训练数据拟合的一整套解决方案。为验证本文提出的基于启发式博弈树搜索的博弈策略求解算法,本文按照国际计算机扑克竞赛规则设计并实现二人非限制性德州扑克智能体,并通过实验分析算法有效性。
其他文献
为了解我国由地方农业科学院主管或主办的综合性农业期刊的整体情况,对22种期刊的基本情况进行调查和比较分析。结果表明:在基本情况中,81.8%被调查期刊为月刊或者旬刊,90.9%
对“标准”在制作IETM过程中的重要性进行了论述。从现有纸型技术手册存在的问题入手 ,指出交互式电子技术手册产品是表达技术信息的最好方法。用分解定义的方法 ,给出了IETM
随着素质教育的不断深化,中学体育教学也得到了改革,体育游戏已成为中学体育教学的有机组成部分,教师作为教学的主导必须对游戏进行合理选择和应用。文章主要阐述了体育游戏
稀土离子由于其独特的4f壳层电子的性质,可以呈现出不同的电子跃迁形式和极其丰富的能级跃迁,因此,稀土离子可以吸收或发射出从紫外到红外区各个波长的光,其优异的发光特性为稀土离子在发光材料中的广泛应用奠定了基础。近年来,稀土发光材料由于具有优异的发光性能、较强的光吸收能力、稳定的化学性质、荧光寿命长、色纯度高、荧光效率高以及能耗低、环境友好等特点,在固态照明、平面显示、激光器件、传感以及生物成像、生物
城乡关系是任何一个国家在发展过程中都不可回避的命题,改革开放以来,我国在打破城乡二元结构、促进城乡协调发展的过程中取得了一系列令人欣喜的成就。党的十九大召开后,面
神经外科的临床教学有与其他外科教学的共同点,也有其作为一个高专业性学科的独特性,在临床教学过程中神经外科代教教师应根据医学临床教学的共同点及神经外科的独特性在教学
稀土氟化物由于其具有稀土元素丰富的4f能级、低声子能和良好的化学稳定性,因而具有独特的光、电和磁等性质,是制备稀土掺杂荧光粉的一种良好的基质材料,因此稀土掺杂氟化物
港口物流是作为物流过程中的一个无可替代的重要节点,逐步形成以航运为核心的物流产业链。我国现代港口系统整合的内容包括:信息流整合、物资流整合和资金流整合。发展中存在
随着上海城市化进程和大型居住区建设的快速推进,大量中心城区人口向郊区迁移,同时外来人口聚集于郊区,这导致郊区常住人口在短时间内快速膨胀,其社会结构发生深刻的变化,这对新型
光纤声传感器相对于传统电声传感器,具有免疫电磁干扰、灵敏度高、大带宽、动态范围大、传感系统灵活和复用性好等优点。近年来光纤声传感技术在国防安全、工业监测、超声无