【摘 要】
:
近几年,计算机围棋成功引发了又一轮的人工智能热潮,从计算机围棋中发展出来的AlphaZero框架成功地应用在其他完全信息条件下的二人有限零和博弈问题,进而展示出了深度学习和
论文部分内容阅读
近几年,计算机围棋成功引发了又一轮的人工智能热潮,从计算机围棋中发展出来的AlphaZero框架成功地应用在其他完全信息条件下的二人有限零和博弈问题,进而展示出了深度学习和强化学习在智能决策领域的优异性能。本文首先介绍了AlphaZero框架中三个核心技术:深度学习、强化学习以及蒙特卡罗树搜索,然后详细说明了AlphaZero框架两个关键阶段——AlphaGo和AlphaGo Zero的基本原理,最后,对AlphaZero框架提出了自己的思考,并基于对AlphaZero原理的剖析讨论了其对军事决策智能化的
其他文献
青教规[2018]71号为全面贯彻落实教育部、国务院扶贫办《深度贫困地区教育脱贫攻坚实施方案(2018—2020年)》和省委办公厅、省政府办公厅《关于加快推进深度贫困地区脱贫攻坚实
民俗文化与幼儿园园本课程这两个分属于不同领域的词汇,因为文化而具有了耦合逻辑关系。它们之间的公共耦合关系凸显了幼儿园民俗文化园本课程的教育本体功能;内容耦合关系体
拖欠工程款现象在中国早已司空见惯。国家建设部、国家计委、财政部曾屡屡颁发文件,要求清理和防止工程拖欠款问题。但由于多种原因.拖欠工程款的问题始终未能得到根治,近些年来
在机器学习领域,监督学习算法在理论层面和工程应用中均取得了丰硕的成果,但此类算法的效果严重依赖训练样本的标签质量,在实际问题中获取具有高质量标签的训练样本通常费时
伴随着一系列房地产交易政策的出台,未来上海房地产业将如何发展已成为社会各界关注的焦点.
本文首次尝试将锂同位素研究应用于打枪沟锂铍矿床岩浆演化与热液作用研究中。对打枪沟与伟晶岩有关的中-酸性岩体进行了系统的采样、测试,结果表明,岩体δ7Li值主要分布于-1
对于有吸毒情节的贩毒人员,一般应当按照其购买的毒品数量认定其贩卖毒品的数量,即使以贩养吸者声称"为自己吸食毒品而留下",也应将这部分毒品数量计入贩卖毒品的数量予以定
<正>2014年,国内第一单类REIT(Real Estate Investment Trust,房地产投资信托)产品推出,市场对REITs反响热烈。随后,很多行业内人士提出,REITs是国内资产证券化市场的一片蓝
小型企业手册──ISO9000质量体系标准的解释及应用指南(5)OISO/TC176顾迎建,徐有刚编译工、ISO9001—1994指南4.质量体系要求标准:4.10检验和试验4.10.且总则供方应建立并保持进行检验和试验活动的文件化程序,以便验证产品