科技王小川预测AlphaGo将完胜李世石：算法没有天花板

漂亮的石头 · 2016-03-09

明日，“人机世纪大战”即将打响，韩国世界冠军李世石九段对战谷歌AlphaGo。此前AlphaGo击败了欧洲围棋冠军樊麾，而李世石是近十年斩获世界冠军最多的棋手。在一些专业人士看来，虽然人工智能终究有一天会战胜世界顶尖旗手，但这个时代没有到来，明天AlphaGo很难战胜李世石。不过在一个月前，搜狗CEO王小川在知乎上发表评论，王小川认为，谷歌人工智能AlphaGo将完胜职业围棋手李世石。

王小川说，AlphaGo的发布，是一个伟大的里程碑，深度学习的魅力在于只要一个领域里能够建模，并有充足的数据，就能够在这个领域里让机器做到超越人、取代人。王小川还大胆预测，3月与韩国九段棋手李世石对弈，AlphaGo依然会完胜。“除了围棋，人工智能在其他博弈类的封闭游戏里，也会横扫一切，完胜人类。”

以下为王小川知乎全文：

AlphaGo的发布，是一个伟大的里程碑，又一次让我兴奋得需要说一说。

先说我的断言一：AlphaGo在两个月后，将会完胜李世石。

留个关子，本文最后再说断言二。

从中学开始，我就着迷用算法来解决游戏的博弈问题，用搜索方法创新性完成过一些题目。这几年深度学习出现后，就感觉有机会能够突破围棋，和清华的联合实验室做过几次探讨，都认为这个方向可行，可惜限于气场和能力不足，没能组织进行这方面的投入。

而此次出手的，是Google旗下的DeepMind团队，在深度学习方面是最顶尖的，资源、能力、气场都没有问题，突破性的技术是基于深度学习进行估值和走棋。

看知乎里好多讨论，是从之前AlphaGo完成的棋局来判断其下棋风格，倒推这个算法的威力，有点刻舟求剑的感觉。我们核心还是要回到对这次AlphaGo用到的技术的深刻理解。

为了便于讨论，我们对比以搜索剪枝为核心的深蓝下国际象棋，和以搜索剪枝+深度学习为核心的AlphaGo的三个区别：

1.围棋相对象棋，最大的区别是棋局的评价函数极难定义。象棋可以找到各种“特征”来计分，比如丢一个马扣多少分，兵往前拱到离底线近了加多少分，而围棋做不到，密密麻麻的黑白子挨着，互相之前又有关联，变化多，规律难以总结。这也是传统算法相对人最弱的几个问题之一。

就像是我们人做人脸识别，看一眼就知道是张三李四，而机器算法难以下手。这个问题恰恰是最近几年深度学习最大的突破之处，深度学习不需要人来设计算法“找特征”，通过大量原始数据和标签的积累，机器就能够自动找特征，并且并不比人差。

在几年前还有很多人认为机器在图像处理方面举步维艰，怎么定义和抽象鼻子？耳朵？眼睛？可就在这一两年深度学习突飞猛进，一举超过了人类。就在2015年，人脸识别方面，机器的识别能力已经超过了人了，这可是人进化了数千万年的核心能力之一呀。

一个围棋棋局，可以理解为一张19*19的图片，其他的走棋规则和非常简单（很容易翻译成计算机规则），正好落入了深度学习擅长的事情。

搜索+深度学习，这个算法完全可以覆盖围棋的规则，人下棋的思维过程和模式，只是AlphaGo的一个子集。这就决定了这个算法没有天花板，有机会在围棋领域“打通关”。

2.深蓝相对AlphaGo，AlphaGo最大的优势是“学习能力”。深蓝的开局更多依靠数据库棋谱的建立，但没有泛化能力（不懂得举一反三），对于没有见过的走棋方法就可能犯傻。而之后的核心能力是计算力，通过暴力的搜索（当然也有最优秀的剪枝，但还是暴力），力图走出10-20步棋来选择最优的路径。

这个复杂度是指数级的，变成一个NP问题，受限于计算力。这个系统的算法是写死的，固定的参数下，就会有固定的表现。而调整参数和改变算法，都是工程师的事情。这个系统的天花板是计算机有多强，以及工程师有多聪明。

而AlphaGo更多是数据驱动的，喂给他更多的棋局数据，他就能够优化“神经元网络”，同样的运算资源下变得更聪明，并且具有举一反三的能力，这一点非常接近于人（或者说本身就是模拟人的方式来设计的）。

而且我们知道，机器处理数据的能力足够地快，以及没有情绪不会出错，这就决定了这个系统如果把今天互联网上能收集到的棋局都学一遍，就成为顶尖高手了。

3.最最最可怕的还不只是前面这两点，对于下棋博弈问题，AlphaGo还不只是从互联网上去收集数据进行学习，更可以自己和自己下，实现“自学习”。看过电影“超验骇客”没有？

人工智能可以做到随着时间的推移就能更加聪明。金庸小说中老顽童让自己左手和右手打架“左右互搏”，成为天下无敌的武功，那个只是故事，在下棋这个领域，而AlphaGo有这样的设计，让这种武功成真了！

往下还有两个月的时间，AlphaGo这样一台算法上没有天花板的机器，很有机会在“左右互搏”下登峰造极，成为不可超越的围棋高手。

AlphaGo的技术问题讲完了。怎么来看Google背后的完整动作呢？有人觉得是过度解读了，实际系统挺糙的——选的都是“欧洲冠军——说明系统并不行，这是一种错误的理解。

更有可能的原因是Google和Fackebook在竞争下围棋，Fackbook的员工缺心眼提前放了好多消息出来泄密了，结果Google就赶紧把Nature的文章发了抢了个先，然后卖个期货两个月后和人类对决，那会儿系统就足够好了，这是在竞争环境下合适的做法。

事实上Google和Facebook两家都认识到了AI的重要性，以及就在最近几年会有大的突破。

Google 4亿美金收购了DeepMind，当时只有20人，现在已经突破200人了，并且是不计代价的疯狂投入。

下围棋只是体现人工智能进步绝佳的宣传点和切入点，从公开的文献可以看到，DeepMind做围棋研发是基于通用的技术进行，领域无关的（Domain independent）。这样的技术未来可以用到合适的其他领域里去。

深度学习的魅力在于，只要一个领域里能够建模，能够有充足的数据，就能够在这个领域里做到超越人、取代人，短时间能从0分做到99分。

如果我们依然是老观念，用渐进的方式来理解机器智能，比如之前某位大佬宣传他家的XX大脑做到了X岁的智力，这是很误(che)导(dan)的。我们同样也会错误地估计下围棋方面机器的能力，按照人类的理解1D-9D来评价它。

一句话，不要用评价人的方法来评价机器的人工智能的能力，完全是不同的模式。

老罗曾经评价过人工智能的一句话：“人工智能就像一列火车，它临近时你听到了轰隆隆的声音，你在不断期待着它的到来。他终于到了，一闪而过，随后便远远地把你抛在身后”。

如果给这句话打上一个补丁，把人工智能的应用局限到一个一个的具体的封闭领域，这是一个很贴切的描述。我们不要过度自大，例如我们容易在自我优越感的驱使下，说动物不如人，比如人会直立行走、会说话、会实用工具，以区别于其他动物。事实证明，动物也会。

面对机器也一样，就在几个月前还有人叫嚣机器十年内不能够玩转围棋，理由也都是人一眼就能看明白，机器只会计算。这些自大会让我们误判。也不用过于自卑，觉得围棋上机器上胜利了人类整个智力就被碾压了，到今天机器还是有很多领域完全无能，只能在局部领域。

到结尾，再说断言二：除了围棋，人工智能在其他博弈类的封闭游戏里，也会横扫一切，完胜人类。

Log in or Sign up

科技王小川预测AlphaGo将完胜李世石：算法没有天花板

漂亮的石头版主 Staff Member

Log in or Sign up

科技 王小川预测AlphaGo将完胜李世石：算法没有天花板

漂亮的石头 版主 Staff Member

科技王小川预测AlphaGo将完胜李世石：算法没有天花板

漂亮的石头版主 Staff Member