论文部分内容阅读
博弈论研究的核心就是寻找博弈问题的解。各种重复剔除算法对于快速约简博弈模型、寻找合理置信的纳什均衡具有极为重要的意义。传统的博弈分析框架总是假定:博弈中的选手是贝叶斯理性的(Bayesian Rational),并且“每个选手是理性的”是选手之间的公共知识(common knowledge)。然而,博弈论本身并没有显性地表达主体的认知成分,自然也就不能精确模型主体间认知交互的高阶信息(higher-order information)变化,从而导致利用某些经典的重复剔除算法求解均衡时出现认知悖论,阻碍了博弈论的进一步发展和完善。同时,尽管模型检测技术作为有限状态系统的自动化验证技术已得到广泛应用,并且也越来越多地在多主体系统(Multi-Agent Systems,简记为MAS)等人工智能领域得到重视,但应用动态模型检测工具判定博弈认知逻辑系统性质、博弈中选手认知状态的属性等方面的工作在国际上尚无研究涉及,这必然会成为基于博弈论研究多主体系统建模技术的发展障碍。
本文首先分析了策略式博弈中各种重复剔除算法的逻辑认知基础,系统地比较了几种常见剔除算法之间的强弱关系,并阐明了对于迅速化简博弈、精炼纳什均衡、寻求更为合理置信博弈解等方面都有着明显优势的重复可允许算法(Iterated Admissibility)的逻辑研究和认知分析的重要意义。其次,基于可能世界语义的Kripke结构,我们分别构建了用于描述纯策略型静态博弈认知结构和混合策略型博弈认知结构的公理化逻辑系统ELG和PEGL(Porbability Epistemic Game Logic)。在这两个系统中,定义出一种更为直观、更符合现实生活中选手博弈时的理性概念,且严格形式化地证明了这种理性概念作为博弈选手问公共知识所导致的认知结果和作为公开宣告事实时所导致的宣告极限都是与IA算法简求解博弈所取得的结果完全一致。因此,我们从静态和动态两种不同认知角度为该算法求解博弈所得的均衡提供了合理置信的认知解释,并有效地克服了该算法背后的认知悖论。最后,基于动态认知模型检测工具DEMO(Dynamic EpistemicModeling),我们开发了动态认知博弈检测工具DEMOGAME。利用它可以检测策略式博弈认知系统的性质以及判定博弈中选手认知状态的属性。实例表明该工具是有效的,同时通过它也成功验证了我们理论成果的正确性。因此,本文研究成果不仅进一步促进了认知博弈论的发展和完善,而且扩展和丰富了当前的多主体体系统模型检测技术。其主要意义体现在以下几个方面:
1)厘清了博弈论中常见剔除算法之间的强弱关系;
2)构建了描述策略式博弈认知结构的逻辑系统ELG和PEGL。基于这些系统,结合本文提出理性定义,形式化证明了:这种理性概念作为博弈选手间公共知识所导致的认知结果,与利用重复可允许算法化简求解博弈的结果是完全吻合,从而为该算法提供了合理置信的认知基础,并避免了该算法背后的认知悖论。
3)通过严格证明我们所定义的理性可以用作公开宣告逻辑PAL(PublicAnnouncement Logic)的宣告事实,进一步表明重复宣告新的理性断定所产生的宣告极限也是与IA算法求解博弈的结果完全一致。从而,动态地刻画了IA算法,更为明晰形象地阐明了IA算法的认知基础;
4)基于动态认知模型检测工具DEMO,开发了可以用于检测双人静态博弈认知系统性质、判定博弈中选手认知状态属性的动态认知博弈模型检测工具DEMOGAME,并用此工具验证了我们理论研究成果的正确性,充分体现我们研究成果的实用价值。
5)对DEMOGAME稍加改动,我们还成功实现了利用该工具验测博弈论中经典的重复剔除严格劣策略LESD(Iterated Elimination ofStrictly Dominated Strategies)算法、可理性化(Rationalizability)算法等结果是否与文[1]中定义的理性主体所做出的认知预测结果相一致,并通过实例表明DEMOGAME还可用于求解双人有限策略式博弈均衡,找出博弈中所有的均衡解以及博弈认知系统性质等问题的判定。
以逻辑为工具研究博弈理论的博弈逻辑和多主体体系统模型检测技术的研究不仅有重要的理论意义,还有重大的实际应用价值。本文是多主体互动理论逻辑建模和模型检测的一些阶段性成果。今后,我们将在此基础上,深入研究PEGL系统,寻找高效的模型检测算法,以实现具有模型检测混合策略型博弈认知结构性质的判定工具。同时,将研究拓展到扩展式博弈研究领域,尝试构建可以用于描述和刻画扩展式博弈认知结构的公理化系统,以期消解动态博弈求解的经典算法——后向归纳法背后的认知悖论。