如何理解 Deepmind 称最新版 AlphaGo 能让李世乭版本的 AlphaGo 三子？

漂亮的石头 · 2017-05-25

日报标题：AlphaGo：「你先连下三子，摆好了叫我一声就行」

不会功夫的潘达，围棋文化

今天，在浙江举办的未来围棋峰会会场上，DeepMind 团队首席科学家 David Sliver 介绍了 AlphaGo 的最新进展。

其中的这张图，吸引了吃瓜群众的眼球。

简单说，就是最新版的 AlphaGo（以下简称 Master），能够让对战李世乭版本的 AlphaGo（以下简称 AlphaGo-Lee）三子。让三子是什么概念？有请柯洁为大家解说。

这个问题，我们还可以再深入一点讨论。

前几年的《围棋天地》杂志，每期有个固定栏目，《36 问》，就是问一位职业棋手 36 个问题。其中一问就是，你认为你和围棋之神的差距多大。我的印象中，除了个别奇葩答案以外，认为棋神让自己三个，双方旗鼓相当的职业棋手是最多的。与之对应，AlphaGo 的机械臂黄士杰博士，去年也曾在推特上说，他也认为围棋之神不能让顶尖职业棋手四个子。

等等，现在 Master 能让 AlphaGo-Lee 三子，而 AlphaGo-Lee 战胜了李世乭，那么 Master 岂不是至少能让李世乭三子？也就是说，最新版本的 AlphaGo，已经和围棋之神能够平起平坐了？

非也。

去年 5 月，就在 AlphaGo- 李世乭五番棋之后，David Silver 在伦敦大学学院做报告，其中也有一张类似的图。

（这图拍的，应该召唤饶罗翔老师）

图中说，AlphaGo-Lee 能够让 Nature 杂志上那一版本的 AlphaGo（以下简称 AlphaGo-Nature）三到四子。这里的让子是带贴目的，所以要打一个小小的折扣。打完折扣以后取平均值，可以认为 AlphaGo-Lee 能够让 AlphaGo-Nature 三子。

注意，在这张图里，AlphaGo-Lee 的等级分是 4500 分！而今天峰会上的图，AlphaGo-Lee 只有 3600+ 分。这也容易解释。在上图的左下角，有一行小字：“注意：等级分评估基于自对弈结果”。也就是说，4500 这个分数是 AlphaGo 的不同版本之间互相战斗之后，根据比分评估的。而 3600+ 这个分数，是根据 AlphaGo-Lee 与人类的对局结果评估的。AlphaGo-Lee 和人类一共就下了五盘棋，也就是对李世乭的 4 胜 1 负。李世乭当时的等级分在 3550 分左右。根据贝叶斯 ELO 算法，将 AlphaGo-Lee 的分数定为 3600+，恰如其分。

那么问题来了，按照 AlphaGo 自评估的 4500 分，她理应碾压李世乭，为什么最后还输了一局呢？

这里涉及到一个概念，“过拟合”。

过拟合，在机器学习领域指，在训练 AI 的过程中，因为样本太少或训练时间太长等原因，训练结果只适应（特殊的）训练样本，而不适应一般情形。用一张图说明。

绿线代表过拟合模型，黑线代表正则化模型。虽然绿线完美的匹配训练数据，但太过依赖，并且与黑线相比，对于新的测试数据上具有更高的错误率。（来自维基百科）

过拟合这个概念，具体表现到 AlphaGo 身上，就是新版本的 AlphaGo 更善于对付旧版本的 AlphaGo，而相对不善于对付一般性的对手，比如李世乭。

讲回 DeepMind 团队今天的报告。

现在再看这张图，应该就豁然开朗了。Master 的 4700 分，同样是基于自对弈的评分。Master 能让 AlphaGo-Lee 三子，可能含有过拟合的水分。因此，Master 能否让柯洁三子，以现有数据无法判断。

也许你想问，Master 到底能让柯洁几个呢？

我的看法是，棋手的水平越高，让子的难度就越大。刚学围棋的人，可能被一个连业余段位都没有的棋手让九个以上。水平相当的业余棋手之间，有“互让三子好胜负”的说法。而据 @傅奇轩说，李世乭九段经常在北京，找业余 6 段棋手下带彩的让三子棋。一盘一万美金，李世乭大致胜负各半。顶尖职业棋手和高水平的业余棋手相比，可以算是两个世界的人，但最多也就让三个子。想让柯洁三个子，难度非常大，也许棋神能做到。

另外，AlphaGo 也有技术问题要解决。对李世乭版本的 AlphaGo，逆风局稳定性远不如顺风局。而让子棋从一开始就是大逆风局。AlphaGo 在逆风局会如何表现，是未来的一大看点。

个人观点。如果现版本的 AlphaGo 对战柯洁，我觉得让两个子会有看头，让三个子我 all in 柯洁。

柯洁应该对自己有信心。今天他发的微博，大概是这个小心机婊在给自己减压吧。无论如何，明天，持白棋的柯洁，请加油！

阅读原文

更多讨论，查看知乎圆桌 · 人机对弈终章

登录或注册

如何理解 Deepmind 称最新版 AlphaGo 能让李世乭版本的 AlphaGo 三子？

漂亮的石头版主管理成员

登录或注册

如何理解 Deepmind 称最新版 AlphaGo 能让李世乭版本的 AlphaGo 三子？

漂亮的石头 版主 管理成员

漂亮的石头版主管理成员