论文部分内容阅读
对于围棋人机大战,很多人折服于AlphaGo的精准、聪明和大局意识.人们问AlphaGo为什么如此厉害,工程师给出的答案是它有“两个大脑”:一个输入了3000万盘人类顶级棋手对弈数据,通过“自我对战”来进行增强学习,改善此前的决策网络;另一个通过价值网络来进行整体局面判断,决策网络与价值网络协作决定落子位置.