不完全信息条件下桥牌博弈算法的研究及应用

来源 :电子科技大学 | 被引量 : 2次 | 上传用户:szm2009szm
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人工智能近年来受到越来越多的关注,并成为今年全国两会的热门话题。机器博弈的研究为人工智能提供了很多方法和理论,如博弈搜索等。机器博弈又分为完全信息博弈和不完全信息博弈,其中由于不完全信息博弈更贴近现实生活中的问题,如战争、股票市场及商场等,受到了越来越多研究者的重视。在现有研究工作的基础上,本文对不完全信息下桥牌博弈算法进行了研究,主要研究内容有以下几个方面:(1)提出了一种基于滑动窗口的抽样时间分配的GHA-BP叫牌学习策略。一直以来,叫牌法则的模糊性是计算机叫牌中需要解决的首要问题。现有的叫牌学习策略虽一定程度上解决了叫牌法则的模糊性,但其在抽样时间分配上不合理,并且基于ID3算法的叫牌预测准确度不高,导致学习叫牌策略能力有限。针对这些问题,本文提出了一种改进的叫牌学习策略,该策略采用滑动窗口对抽样时间进行预测分配,采用GHA-BP神经网络对模糊的叫牌法则进行分类学习。实验表明,该策略能够更合理地分配有限的时间和提高叫牌学习策略的准确率,降低与双明手叫牌结果的差异。(2)提出了一种基于启发式的蒙特卡罗打牌策略。一直以来,信息的不完全性是打牌过程中需要解决的首要问题。现有的蒙特卡罗打牌策略中通过随机抽样的方法为解决该问题提供了一种可行的思路,但常规抽样方法由于其盲目性存在抽样效率低的问题。因此,本文提出了一种改进的蒙特卡罗打牌策略,该策略将启发式的思想应用于生成样本牌局。实验验证了本策略能够在相同时间内产生更多满足叫牌约束的样本,能更准确地模拟当前状态的牌局,从而做出更为合理的打牌决策。(3)基于前面桥牌博弈算法的研究,本文设计并实现了一个计算机桥牌博弈系统。该系统包括控制系统和桥牌AI程序。控制系统实现了桥牌AI之间的通信功能,桥牌AI实现并验证了本文提出的叫牌及打牌算法。
其他文献
本论文提出了一种基于Rough集理论改进的HOG特征行人检测方法,目的是提高检测精度的同时加快行人检测的速度。原HOG特征是在64*128像素的检测窗口中提取105个Block,每个Block
近年来,在线广告、实时统计分析等时效性敏感的数据处理场景越来越多。数据流处理技术因为其高时效性成为新的研究热点。数据流处理技术能提供实时、可靠、易用和可伸缩的计
无线传感器网络(Wireless Sensor Network,WSN)就是由部署在监测区域内大量的微型传感器节点组成,通过无线通信方式形成的一个多跳的自组织的网络系统。其目的是协作地感知、
近年来,随着分布式计算技术的发展,传统的分布式对象模型在面对Internet环境时暴露出一些缺点。主要表现在:客户端与服务器之间存在较大的网络通信量与交互信息;实现技术框架
随着计算机科学技术与无线宽带通信技术的不断发展,以及智能手机、平板电脑等移动设备的应用普及,人们的互联网生活迎来了巨大的变化。本文基于传统的远程屏幕监控技术,将系
心电图的自动分类研究一直是近年来信号处理领域的研究热点之一,在重症监护室、可穿戴心电设备、疾病与心脏活动关系研究、评价起搏器功能等方面有着广泛应用。通过引入计算机
随着高速铁路以及随之而来的动车组在中国的飞速发展,动车组的安全运行与故障处理变得日益重要。因此,车载无线传输设备技术(WTD技术)应运而生,通过对车辆的状态信息进行采集,处
人工免疫系统(Artificial Immune System,AIS)是借鉴生物免疫系统的诸多特性,如分布式检测、自适应性、多样性、记忆性等,用来解决网络安全中所遇到的问题的一门新兴学科。其
随着信息技术的发展和传统实验系统的升级,提高实验平台的利用率和增强服务能力的成为业界研究的热点。云计算(CloudComputing)为实验平台提供了有力的支撑,然而如何有效的利用云
智能视频监控系统是计算机视觉研究领域的一个重要课题,而运动对象检测则是智能监控系统的核心技术。运动对象检测的研究对象是视频图像序列,其目的是判断视频序列中是否存在