澎湃Logo
下载客户端

登录

  • +1

阿尔法狗之父:我们可不只会围棋,还要造探索宇宙的终极工具

澎湃新闻记者 王心馨 虞涵棋 发自乌镇
2017-05-24 13:19
来源:澎湃新闻
科学湃 >
字号

AlphaGo又赢了。在过去的一年间,人们已经听到了太多人工智能程序战胜人类棋手的消息。在外界普遍不看好柯洁的情况下,比起比赛结果,更多人好奇的是:AlphaGo这次为什么还要来中国“踢馆”?连“当今第一人”柯洁都倒下了,独孤求败的AlphaGo是不是可以准备“退役”了?而AlphaGo背后的DeepMind公司在玩坏了围棋之后,下一步还打算玩什么?

戴密斯·哈萨比斯。东方IC  图

5月24日,在中国乌镇人工智能高峰论坛上,AlphaGo之父、DeepMind创始人戴密斯·哈萨比斯(Demis Hassabis)介绍道,AlphaGo的影响已经开始显现,比如在与韩国棋手李世石对决后,围棋的棋盘销量增加了10倍的增量;利用AlphaGo的算法,许多公司也开始深入研究人工智能下棋程序以及各种应用场景的应用。

随后,他重申,下围棋并不是AlphaGo的终极奥义,他们的目标是要利用AlphaGo打造通用的、探索宇宙的终极工具。

在哈萨比斯看来,要打造能探索宇宙的终极工具,就需要把AlphaGo改造成通用型学习机器。具体来说,这个机器能做到非程序预设,就能自主学习原始材料,并能在同一系统执行多种任务。要做到这两点非常困难,但AlphaGo正在利用下围棋的方式来向这个目标靠近。

澎湃新闻记者 王心馨 图,下同
为什么计算机下围棋非常困难?

1997年,国际象棋大师卡斯帕罗夫败给了IBM公司打造的“深蓝”程序,国际象棋被计算机攻克。相比国际象棋每一步棋后能引出三十种可能的走法,围棋棋局的每一步牵出的后续选择有数百种。计算机需要搜索的数量更加庞大。

在哈萨比斯看来,用计算机下围棋主要的困难有四点。首先,围棋是一个靠直觉来赢得比赛的项目,它不像象棋等游戏可以靠计算。其次,围棋中没有等级概念,所有棋子都一样。第三,围棋是筑防游戏,需要盘算未来。第四,围棋中小小的一颗子就可以撼动全局。

基于此,在AlphaGo打败李世石之前,许多人认为人类至少10年才能完成这个目标。但在2016年,DeepMind利用策略和价值网络打造AlphaGo,成功撼动了人类在围棋领域的统治力。

AlphaGo之所以有如此“神力”,甚至被柯洁称为“围棋上帝”主要就是依靠这两个网络。首先,AlphaGo用策略网络可以缩小了每一步棋走法的选择。接着,走完每一步棋,AlphaGo都能利用价值网络来评估这步棋的胜率值。

AlphaGo已具备直觉和创造力

依靠这两个网络,通过向人类围棋大师学习,以及迭代后的自我学习,哈萨比斯认为当前版本的AlphaGo已经具备直觉和创造力。

比如,年初以“Master”马甲出现,对战中日韩顶尖高手取得60连胜时,AlphaGo在与辜梓豪、朴廷桓下棋时,都走出了精彩的一招,显示出了创造力。

“游戏是用来训练算法最有效的做法,但是我觉得最终我们的目标并不是游戏,而是把我们的技术运用到现实生活当中,比如说用到医疗、智能手机以及教育当中。”哈萨比斯说。

据介绍,接下去DeepMind公司有意让AlphaGo与无数其他领域结合,从而能得到无数的“组合轰炸”。目前,DeepMind的搜索技术已经运用到谷歌的数据中心,帮助该数据中心节省了15%的电能。

更为重要的是,哈萨比斯期望AlphaGo能成为元解决方案。简单理解就是,让AlphaGo成为人工智能科学家或者人工智能辅助科学家,更好地理解人脑的奥秘。

“和所有强大的新技术一样,我们希望AlphaGo能在伦理和责任的约束中造福人类,探索人类大脑的奥秘。”哈萨比斯说。

    校对:丁晓
    澎湃新闻报料:021-962866
    澎湃新闻,未经授权不得转载
    +1
    收藏
    我要举报

            扫码下载澎湃新闻客户端

            沪ICP备14003370号

            沪公网安备31010602000299号

            互联网新闻信息服务许可证:31120170006

            增值电信业务经营许可证:沪B2-2017116

            © 2014-2024 上海东方报业有限公司

            反馈