1. XenForo 1.5.14 中文版——支持中文搜索!现已发布!查看详情
  2. Xenforo 爱好者讨论群:215909318 XenForo专区

科技 [视频]谷歌DeepMind AI已经掌握超难雅达利游戏

Discussion in '新闻聚焦' started by 漂亮的石头, 2016-06-10.

  1. 漂亮的石头

    漂亮的石头 版主 Staff Member

    Joined:
    2012-02-10
    Messages:
    488,439
    Likes Received:
    48
    与李世石一战成名后,AlphaGo背后的谷歌DeepMind人工智能团队越来越受到业界关注。DeepMind团队的领导人Demis Hassabis与游戏界的渊源由来已久,在AlphaGo成名之前DeepMind团队最初用来测试AI的都是雅达利的老游戏。



    最早DeepMind的老版本AI在超难的游戏《Montezuma’s revenge》中表现欠佳,但是在经过长时间的学习和试错后,DeepMind团队新版本的AI真正地掌握了游戏大师级技巧。其学习过程并无采取任何捷径,没有被提供额外的信息。真正地模仿人类学习过程,DeepMind的人工智能已经学会了躲避技巧,拾取钥匙,像专家一样努力争取最高分。​

    DeepMind在新版本的AI中加入了一种名为“好奇心”的内部激励机制,游戏AI能够更趋向于获得更高分,并积极探索更多不同的游戏方法获得更好的回报。这项机制能够允许新版本 的AI更加积极地去探索游戏要素,掌握游戏方法。​

    从以下对比可以看出来,老版本AI仅探索了2间游戏房屋,新版本AI则由新机制驱动探索了共15间游戏房屋。​

    [​IMG]
     
Loading...