非完备信息博弈估值算法的研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:aifuweimin
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
计算机博弈是人工智能研究领域一个重要的分支,也是博弈理论研究的热点方向之一。博弈论按照博弈的参与者是否掌握所有的局面信息可以分为完备信息博弈和非完备信息博弈。其中完备信息博弈的研究水平已经接近或者超过人类的博弈水平,而非完备信息博弈由于未知信息太多导致其发展相对缓慢,有更为广阔的研究空间。近些年来,人工智能技术逐渐成熟,计算机分布式计算及集群技术也不断发展,非完备信息博弈迎来了发展的大好机会。估值算法是非完备信息博弈中的一个重要的组成部分,估值算法对博弈中的不同策略进行评估,通过评估结果的高低来判断策略的好坏。估值算法是机器博弈系统中的核心,是区分不同计算机博弈程序优劣的关键因素之一,能够直接反应计算机博弈体的智能水平。德州扑克是典型的非完备信息博弈牌类游戏,具有一定的代表性,本文主要以计算机德州扑克为实验对象,研究非完备信息博弈下的估值算法。在博弈问题中,人工神经网络算法一般用来预测对手的动作,本文在前人的研究基础上,改进了人工神经网络估值算法模型,利用博弈专家的玩法记录来训练该模型,进而学习专家的博弈策略并为自己动作的做参考。只学习单一专家博弈策略的系统容易被对手建立模型,对手有针对性的攻击会导致博弈系统性能变差。因此,本文提出了通过抽样的方式来向多个博弈专家进行学习,并在抽样的过程中引入权值更新和动态调整,一定程度上提高了博弈体的智能水平。随着计算机运算能力的提高,基于人工神经网络算法的深度神经网络算法获得了广泛的关注,深度神经网络结构具有多个隐藏层,每个隐藏层包括多个隐藏节点,与浅层网络相比,它具有更强大的建模能力与表征能力。本课题利用深度神经网络算法来预测博弈中对手的行为。本课题将人工神经网络估值算法和德州扑克博弈相结合,最后实现了一个计算机德州扑克博弈程序并参加了2014年AAAI计算机德州扑克大赛,取得了第三名的成绩。
其他文献
并行处理技术已经引起了石油地球物理界的广泛关注,如何将现有地震数据处理模块快速,高效地移植到集群上已成为地震数据处理需要解决的重大课题。面向大规模、高精度并行地震
多序列比对和系统发育分析是生物信息学的重要研究领域。通过多序列比对和系统发育可以预测新序列的结构和功能,分析序列之间的同源关系。提高序列的多序列比对准确率和重构
随着全球互联网(Internet)的迅猛发展,网络软硬件技术的快速提升,宽带网络迅速普及。以视频会议、视频点播、远程教育为代表的新型多媒体组播应用成了宽带网络的宠儿,日益受到人
近年来离散制造企业高度重视信息化的建设,经过几年的发展,已初具成效。在几年的业务发展中,企业内产生了大量的信息化数据,包括办公文档、业务订单、数据报表、图片、音频、
近年来随着多媒体应用的领域逐渐扩展,人们在对新的先进编码技术进行理论研究的同时,也加大了实用化的力度。目前MPEG-4视频的简单框架(SimpleProfile)方案以其在低码率、高
随着Internet高速网络中实时和多媒体应用业务的迅速发展,要求通信网络能提供高效的服务质量(QoS)支持,但是传统的“尽力而为”网络机制并不能满足QoS通信的要求,近几年的研
Web是为了实现程序到用户的交互,而Web Services则是为程序到程序的交互做准备。Web Services使公司可以降低进行电子商务的成本、更快的部署解决方案以及开拓新机遇。其关键
目前,我们已经进入了以网络计算为中心的时代,人们迫切需要在任何时候、任何地点访问所需数据,移动计算为之提供了手段。它是无线通信、网络技术与移动计算设备相结合的产物,是一
随着网络技术和通信技术的不断发展,电子商务已经不再局限于以往的交易模式和技术模式,因为计算机已经不是唯一的一种能够进行互联网通信的终端设备。并且随着经济的发展,电子商
随着互联网、云计算、移动计算的发展,高质量高效率的自然语言处理应用有力的促进了智能人机交互的发展。然而,大多数的自然语言处理应用需要大规模的统计模型,高质量的算法