桥牌叫牌搜索算法及局面可视化系统的研究和实现

来源 :北京邮电大学 | 被引量 : 2次 | 上传用户:cheng1129
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在很多完备信息下机器博弈的问题如黑白棋、象棋、围棋等人工智能问题逐渐的被解决时,越来越多的人将目光转移到德州扑克、桥牌等非完备信息下的机器博弈问题中来。其中桥牌作为规则最复杂的牌类游戏之一,具有较高的研究价值。桥牌游戏分为叫牌和打牌两个过程,提出了一种解决桥牌游戏中叫牌问题的算法框架,该框架能够学习人类现有的叫牌体系并产生合理的叫牌决策,并针对该框架设计并实现了局面理解可视化系统,该系统可以将算法对局面的理解直观的展示出来。本文首先利用隐马尔科夫模型和深度神经网络,对桥牌叫牌过程进行了建模,构建桥牌体系模型。然后通过在某个体系下的人类牌局数据来训练体系模型,使得体系模型能够预测出该体系下下一 口叫品的概率分布,并且能够理解该体系下队友叫牌的含义,产生对局面理解的预测。算法框架能够在体系模型预测的局面理解之上进行高效的蒙特卡洛采样,并且在体系模型的指导下对采样质量进行评估和筛选,生成其余三位玩家的手牌采样,将非完备信息转化为完备信息,最终通过搜索算法来产生叫牌决策。在采样和搜索的过程中,体系模型的存在保证了采样和搜索在合理的范围内进行,使得最终的叫牌决策仍然受到叫牌体系的约束。让模型能够可视化展示自身对局面的理解同样十分重要。局面理解的可视化不仅能够对模型本身做出的决策做出一定的解释,还能对叫牌体系的研究起到帮助作用。本文设计和实现了将算法得到的局面理解进行可视化表达的系统,该系统可以有效地利用GPU和CPU计算资源运行深度学习模型和各种搜索算法,并且能够将局面理解直观地表示出来。针对桥牌叫牌质量难以评估的特点,本文对非实质性叫品和实质性叫品设计了不同的评估方法,并且构建了双明手分析模型来辅助衡量叫牌质量。最后,根据系统的最终效果,分析了可能存在的问题,并根据问题确定了未来的工作方向。
其他文献
绿色离子液体是指以生物阳离子和生物阴离子组成的离子液体,胆碱氨基酸离子液体([Ch][AA])是以生物碱胆碱(Ch)为阳离子,氨基酸(AA)为阴离子的一类离子液体,此类离子液体完全由生物材料合成,其毒性小,生物亲和力好,被视作一种“绿色离子液体”。本文合成了胆碱氨基酸离子液体,并将其应用于目标分析物的分离分析,主要内容包括:1.合成胆碱丙氨酸离子液体[Ch][Ala],建立双水相萃取-高效液相色谱
近年来,随着运算能力的提升和卷积神经网络的发展,计算机在目标跟踪任务中准确度和速度已经得到很大提高。然而,由于热红外图像具有分辨率低、缺少细节纹理信息、背景杂波强等特点,红外行人精准快速跟踪任务仍存在一定困难与挑战。由于基于孪生结构网络和相关滤波算法的跟踪器在可见光目标跟踪挑战中取得了较好的跟踪结果,本文将候选区域孪生网络跟踪器(Siamese region proposal network,Si
作为一种“节能减排、低投高效”模式,循环农业已经成为世界各国农业发展的趋势,我国也通过构建循环农业国家发展标准与技术模式,大力推广循环农业系统建设。但如何更好地协调循环系统社会、经济、生态效益,特别通过对循环系统经济性、循环性、生态性的评估,发现存在的问题与不足,从而形成完善系统、提升效率的优化方案,对循环农业健康发展无疑十分重要。有鉴于此,本文以辽宁省田园生态科技园的“猪-沼-菜”循环系统为研究
性激素依赖性疾病(Sex hormone dependence disease)——子宫内膜异位症、子宫腺肌症(病)、子宫肌瘤等是妇科常见病,特别是子宫内膜异位症,不仅发病率高,且有恶性肿瘤样种植
会议
随着社会经济的快速发展,传统的精确数已经很难解决现实决策问题。模糊集概念的提出为我们研究不确定信息打开了新的视角,引起了学者的广泛关注。基于模糊集理论,学者们相继提出了直觉模糊集、毕达哥拉斯模糊集等概念。毕达哥拉斯模糊集是基于直觉模糊集的进一步拓展,相较于直觉模糊集,毕达哥拉斯模糊集在表征不确定信息方面容纳性更高,在刻画模糊多属性决策问题上适用性更强。因此,众多学者运用毕达哥拉斯模糊集来研究多属性
在我国油田企业面临资源储量下降的背景下,只有不断加强绩效管理,用绩效管理保证“人”的活力的方式提升管理水平,才能提升整体运营效果,以适应改革与发展的需要。目前原油开采项目长期以来缺乏科学的绩效管理手段,导致基层效率低下,员工积极性不高,总体统筹能力差,采油企业集约化、扁平化、精益化发展必然路径要求有与之相匹配的科学绩效管理体系相适应。DJ采油厂致密油项目中针对绩效管理主要是三个维度,即业绩考核、能
程序语法纠错任务是目前的一个研究热点,现有的方法主要是使用上下文无关文法和深度学习相结合的模型来提高纠错的准确率。深度学习模型在语法纠错任务上取得了越来越好的结果,但模型也变得庞大、复杂,导致模型训练速度慢。在监督学习方法中,复杂模型的训练需要大量的已标注修复动作的错误代码,而目前没有合适的自动化标记语法错误的方法,使得可用的真实数据集较少。迁移学习可以从相关领域中迁移标注数据或知识结构,改进目标
脑磁共振图像的定量分析是计算机辅助诊断和监测帕金森病(Parkinson’s disease,PD)的一个重要手段。由于脑整体结构的复杂性和PD病理改变的多样性,针对单个或局部结构的分析
本文通过邻香兰素及3,5-二氯水杨醛与不同的二胺进行反应,合成了5个新的席夫碱配体H2L1-5,并通过核磁共振等谱图对这些配体进行了结构表征。以这5个配体与不同金属盐反应得到
为研究垫料制备方法对生物发酵床在育肥猪生产性能、血液生化指标、发病率、猪舍温度以及相对湿度、舍内有害气体含量、垫料下沉厚度、经济效益等方面的影响,并和以往的传统