1. XenForo 1.5.14 中文版——支持中文搜索!现已发布!查看详情
  2. Xenforo 爱好者讨论群:215909318 XenForo专区

科技 王小川预测AlphaGo将完胜李世石:算法没有天花板

Discussion in '新闻聚焦' started by 漂亮的石头, 2016-03-09.

  1. 漂亮的石头

    漂亮的石头 版主 Staff Member

    Joined:
    2012-02-10
    Messages:
    488,399
    Likes Received:
    48
    明日,“人机世纪大战”即将打响,韩国世界冠军李世石九段对战谷歌AlphaGo。此前AlphaGo击败了欧洲围棋冠军樊麾,而李世石是近十年斩获世界冠军最多的棋手。在一些专业人士看来,虽然人工智能终究有一天会战胜世界顶尖旗手,但这个时代没有到来,明天AlphaGo很难战胜李世石。 不过在一个月前,搜狗CEO王小川在知乎上发表评论,王小川认为,谷歌人工智能AlphaGo将完胜职业围棋手李世石。


    王小川说,AlphaGo的发布,是一个伟大的里程碑,深度学习的魅力在于只要一个领域里能够建模,并有充足的数据,就能够在这个领域里让机器做到超越人、取代人。王小川还大胆预测,3月与韩国九段棋手李世石对弈,AlphaGo依然会完胜。“除了围棋,人工智能在其他博弈类的封闭游戏里,也会横扫一切,完胜人类。”​

    以下为王小川知乎全文:

    AlphaGo的发布,是一个伟大的里程碑,又一次让我兴奋得需要说一说。​

    先说我的断言一:AlphaGo在两个月后,将会完胜李世石。​

    留个关子,本文最后再说断言二。​

    从中学开始,我就着迷用算法来解决游戏的博弈问题,用搜索方法创新性完成过一些题目。这几年深度学习出现后,就感觉有机会能够突破围棋,和清华的联合实验室做过几次探讨,都认为这个方向可行,可惜限于气场和能力不足,没能组织进行这方面的投入。​

    而此次出手的,是Google旗下的DeepMind团队,在深度学习方面是最顶尖的,资源、能力、气场都没有问题,突破性的技术是基于深度学习进行估值和走棋。​

    看知乎里好多讨论,是从之前AlphaGo完成的棋局来判断其下棋风格,倒推这个算法的威力,有点刻舟求剑的感觉。我们核心还是要回到对这次AlphaGo用到的技术的深刻理解。​

    为了便于讨论,我们对比以搜索剪枝为核心的深蓝下国际象棋,和以搜索剪枝+深度学习为核心的AlphaGo的三个区别:​

    1.围棋相对象棋,最大的区别是棋局的评价函数极难定义。象棋可以找到各种“特征”来计分,比如丢一个马扣多少分,兵往前拱到离底线近了加多少分,而围棋做不到,密密麻麻的黑白子挨着,互相之前又有关联,变化多,规律难以总结。这也是传统算法相对人最弱的几个问题之一。​

    就像是我们人做人脸识别,看一眼就知道是张三李四,而机器算法难以下手。这个问题恰恰是最近几年深度学习最大的突破之处,深度学习不需要人来设计算法“找特征”,通过大量原始数据和标签的积累,机器就能够自动找特征,并且并不比人差。​

    在几年前还有很多人认为机器在图像处理方面举步维艰,怎么定义和抽象鼻子?耳朵?眼睛?可就在这一两年深度学习突飞猛进,一举超过了人类。就在2015年,人脸识别方面,机器的识别能力已经超过了人了,这可是人进化了数千万年的核心能力之一呀。​

    一个围棋棋局,可以理解为一张19*19的图片,其他的走棋规则和非常简单(很容易翻译成计算机规则),正好落入了深度学习擅长的事情。​

    搜索+深度学习,这个算法完全可以覆盖围棋的规则,人下棋的思维过程和模式,只是AlphaGo的一个子集。这就决定了这个算法没有天花板,有机会在围棋领域“打通关”。

    2.深蓝相对AlphaGo,AlphaGo最大的优势是“学习能力”。深蓝的开局更多依靠数据库棋谱的建立,但没有泛化能力(不懂得举一反三),对于没有见过的走棋方法就可能犯傻。而之后的核心能力是计算力,通过暴力的搜索(当然也有最优秀的剪枝,但还是暴力),力图走出10-20步棋来选择最优的路径。​

    这个复杂度是指数级的,变成一个NP问题,受限于计算力。这个系统的算法是写死的,固定的参数下,就会有固定的表现。而调整参数和改变算法,都是工程师的事情。这个系统的天花板是计算机有多强,以及工程师有多聪明。​

    而AlphaGo更多是数据驱动的,喂给他更多的棋局数据,他就能够优化“神经元网络”,同样的运算资源下变得更聪明,并且具有举一反三的能力,这一点非常接近于人(或者说本身就是模拟人的方式来设计的)。

    而且我们知道,机器处理数据的能力足够地快,以及没有情绪不会出错,这就决定了这个系统如果把今天互联网上能收集到的棋局都学一遍,就成为顶尖高手了。​

    3.最最最可怕的还不只是前面这两点,对于下棋博弈问题,AlphaGo还不只是从互联网上去收集数据进行学习,更可以自己和自己下,实现“自学习”。看过电影“超验骇客”没有?​

    人工智能可以做到随着时间的推移就能更加聪明。金庸小说中老顽童让自己左手和右手打架“左右互搏”,成为天下无敌的武功,那个只是故事,在下棋这个领域,而AlphaGo有这样的设计,让这种武功成真了!​

    往下还有两个月的时间,AlphaGo这样一台算法上没有天花板的机器,很有机会在“左右互搏”下登峰造极,成为不可超越的围棋高手。​

    AlphaGo的技术问题讲完了。怎么来看Google背后的完整动作呢?有人觉得是过度解读了,实际系统挺糙的——选的都是“欧洲冠军——说明系统并不行,这是一种错误的理解。​

    更有可能的原因是Google和Fackebook在竞争下围棋,Fackbook的员工缺心眼提前放了好多消息出来泄密了,结果Google就赶紧把Nature的文章发了抢了个先,然后卖个期货两个月后和人类对决,那会儿系统就足够好了,这是在竞争环境下合适的做法。​

    事实上Google和Facebook两家都认识到了AI的重要性,以及就在最近几年会有大的突破。​

    Google 4亿美金收购了DeepMind,当时只有20人,现在已经突破200人了,并且是不计代价的疯狂投入。​

    下围棋只是体现人工智能进步绝佳的宣传点和切入点,从公开的文献可以看到,DeepMind做围棋研发是基于通用的技术进行,领域无关的(Domain independent)。这样的技术未来可以用到合适的其他领域里去。​

    深度学习的魅力在于,只要一个领域里能够建模,能够有充足的数据,就能够在这个领域里做到超越人、取代人,短时间能从0分做到99分。

    如果我们依然是老观念,用渐进的方式来理解机器智能,比如之前某位大佬宣传他家的XX大脑做到了X岁的智力,这是很误(che)导(dan)的。我们同样也会错误地估计下围棋方面机器的能力,按照人类的理解1D-9D来评价它。​

    一句话,不要用评价人的方法来评价机器的人工智能的能力,完全是不同的模式。​

    老罗曾经评价过人工智能的一句话:“人工智能就像一列火车,它临近时你听到了轰隆隆的声音,你在不断期待着它的到来。他终于到了,一闪而过,随后便远远地把你抛在身后”。​

    如果给这句话打上一个补丁,把人工智能的应用局限到一个一个的具体的封闭领域,这是一个很贴切的描述。我们不要过度自大,例如我们容易在自我优越感的驱使下,说动物不如人,比如人会直立行走、会说话、会实用工具,以区别于其他动物。事实证明,动物也会。​

    面对机器也一样,就在几个月前还有人叫嚣机器十年内不能够玩转围棋,理由也都是人一眼就能看明白,机器只会计算。这些自大会让我们误判。也不用过于自卑,觉得围棋上机器上胜利了人类整个智力就被碾压了,到今天机器还是有很多领域完全无能,只能在局部领域。​

    到结尾,再说断言二:除了围棋,人工智能在其他博弈类的封闭游戏里,也会横扫一切,完胜人类。​
     
Loading...