澎湃Logo
下载客户端

登录

  • +1

Master没学过人类棋谱?这才是他比老阿法狗更恐怖之处

澎湃新闻记者 蒲垚磊
2017-01-05 01:02
来源:澎湃新闻
运动家 >
字号

在Master完成60胜,结束人机车轮战后,因与AlphaGo对战而成名的欧洲围棋冠军樊麾就在社交网络上发表了一篇公告。

在这篇公告中,谷歌公司明确表示Master是“阿法狗”的升级测试版,而在其中更是有个惊人的所在——Master可能完全没学过棋谱,而这也侧面印证了Master不按常理出牌的套路。

柯洁微博。

人类与人工智能共同探索围棋?

樊麾目前是谷歌DeepMind团队测试工程师,在公告中,樊麾代表DeepMind团队写道:

“我们最近很努力地开发阿尔法围棋,刚过去的几天我们在网络的对弈平台进行了一些非正式的快棋对局,目的是为了检验我们最新版本的阿尔法围棋是否如我们的预期。”

“我们需要感谢所有与我们的Magister(P) 和Master(P) 账户在弈城围棋网以及野狐围棋网对弈的棋手,也要感谢所有观战的人!最新的阿尔法围棋在对局中所富有启发性的创新,我们从中可以学到的,以及对局的结果都令我们非常激动。”

谷歌团队声明。

在这段公告中还有耐人寻味的一段:

“世界冠军古力与阿尔法围棋对弈以后写了,‘人类与人工智能共同探索围棋世界的大幕即将拉开’。我们现在结束了非正式的测试,非常期望今年能有机会与围棋组织以及专家共同探索神秘的围棋,在相互启发的气氛中共同领会围棋的奥妙。我们希望尽快发布其他公告。”

人类与人工智能共同探索围棋世界的大幕即将拉开?是的,谷歌看上去是要将围棋AI领域探索作为一个重要突破口。

要知道,DeepMind公司创始人哈萨比斯此前在一次采访中曾透露,他们的团队正在尝试训练一个没有学习过人类棋谱的人工智能,这也可能就是Master和AlphaGo不同的原因。

如果Master真的没有学习过人类棋谱,而有了突飞猛进的实力,那恰恰印证了谷歌AI技术的全新突破。

《自然》杂志封面。

它的棋力哪里是极限?

AlphaGo的棋力已经不言而喻,但更可怕的是它的学习能力。

在2015年10月,AlphaGo在与欧洲冠军樊麾的对弈中就在公平的情况下以5比0完胜。樊麾在接受媒体采访时认为,AlphaGo的可怕在于“从不犯错”。

但在樊麾与AlphaGo的五盘大战棋谱被放上网络后,就有不少围棋业余高手在网络上发表评论,其中不少人认为樊麾这次的棋下得并不出色。

但当时《自然》杂志就写道,“人类在下棋时有一个劣势,在长时间比赛后,他们会犯错,但机器不会。而且人类或许一年能玩1000局,但机器一天就能玩100万局。”

“围棋AI的学习能力非常强大,就像当初‘深蓝’第一次输给了卡斯帕罗夫,但不到一年第二次对弈就赢了比赛。”

据《自然》杂志介绍,AlphaGo的核心是两种不同的深度神经网络:“策略网络”(policy network)和 “值网络”(value network)。它们的任务在于合作“挑选”出那些比较有前途的棋步,抛弃明显的差棋。

更恐怖的是它的“进化”深度学习能力,用了2000万局的对子对弈进行训练,每一次都能提升棋力。

    澎湃新闻报料:021-962866
    澎湃新闻,未经授权不得转载
    +1
    收藏
    我要举报

            扫码下载澎湃新闻客户端

            沪ICP备14003370号

            沪公网安备31010602000299号

            互联网新闻信息服务许可证:31120170006

            增值电信业务经营许可证:沪B2-2017116

            © 2014-2024 上海东方报业有限公司

            反馈