下载客户端

Master没学过人类棋谱？这才是他比老阿法狗更恐怖之处

澎湃新闻记者蒲垚磊

2017-01-05 01:02

来源：澎湃新闻

∙ 运动家 >

在Master完成60胜，结束人机车轮战后，因与AlphaGo对战而成名的欧洲围棋冠军樊麾就在社交网络上发表了一篇公告。

在这篇公告中，谷歌公司明确表示Master是“阿法狗”的升级测试版，而在其中更是有个惊人的所在——Master可能完全没学过棋谱，而这也侧面印证了Master不按常理出牌的套路。

柯洁微博。

人类与人工智能共同探索围棋？

樊麾目前是谷歌DeepMind团队测试工程师，在公告中，樊麾代表DeepMind团队写道：

“我们最近很努力地开发阿尔法围棋，刚过去的几天我们在网络的对弈平台进行了一些非正式的快棋对局，目的是为了检验我们最新版本的阿尔法围棋是否如我们的预期。”

“我们需要感谢所有与我们的Magister(P) 和Master(P) 账户在弈城围棋网以及野狐围棋网对弈的棋手，也要感谢所有观战的人！最新的阿尔法围棋在对局中所富有启发性的创新，我们从中可以学到的，以及对局的结果都令我们非常激动。”

谷歌团队声明。

在这段公告中还有耐人寻味的一段：

“世界冠军古力与阿尔法围棋对弈以后写了，‘人类与人工智能共同探索围棋世界的大幕即将拉开’。我们现在结束了非正式的测试，非常期望今年能有机会与围棋组织以及专家共同探索神秘的围棋，在相互启发的气氛中共同领会围棋的奥妙。我们希望尽快发布其他公告。”

人类与人工智能共同探索围棋世界的大幕即将拉开？是的，谷歌看上去是要将围棋AI领域探索作为一个重要突破口。

要知道，DeepMind公司创始人哈萨比斯此前在一次采访中曾透露，他们的团队正在尝试训练一个没有学习过人类棋谱的人工智能，这也可能就是Master和AlphaGo不同的原因。

如果Master真的没有学习过人类棋谱，而有了突飞猛进的实力，那恰恰印证了谷歌AI技术的全新突破。

《自然》杂志封面。

它的棋力哪里是极限？

AlphaGo的棋力已经不言而喻，但更可怕的是它的学习能力。

在2015年10月，AlphaGo在与欧洲冠军樊麾的对弈中就在公平的情况下以5比0完胜。樊麾在接受媒体采访时认为，AlphaGo的可怕在于“从不犯错”。

但在樊麾与AlphaGo的五盘大战棋谱被放上网络后，就有不少围棋业余高手在网络上发表评论，其中不少人认为樊麾这次的棋下得并不出色。

但当时《自然》杂志就写道，“人类在下棋时有一个劣势，在长时间比赛后，他们会犯错，但机器不会。而且人类或许一年能玩1000局，但机器一天就能玩100万局。”

“围棋AI的学习能力非常强大，就像当初‘深蓝’第一次输给了卡斯帕罗夫，但不到一年第二次对弈就赢了比赛。”

据《自然》杂志介绍，AlphaGo的核心是两种不同的深度神经网络：“策略网络”（policy network）和 “值网络”（value network）。它们的任务在于合作“挑选”出那些比较有前途的棋步，抛弃明显的差棋。

更恐怖的是它的“进化”深度学习能力，用了2000万局的对子对弈进行训练，每一次都能提升棋力。

澎湃新闻报料：021-962866

澎湃新闻，未经授权不得转载

我要举报

#围棋人机大战

扫码下载澎湃新闻客户端

澎湃矩阵

新闻报料

报料热线: 021-962866
报料邮箱: news@thepaper.cn

沪ICP备14003370号

沪公网安备31010602000299号

互联网新闻信息服务许可证：31120170006

增值电信业务经营许可证：沪B2-2017116

反馈