澎湃Logo
下载客户端

登录

  • +1

柯洁谈5月对阵阿尔法狗:抱必死信念,一定要赢

澎湃新闻记者 王歆悦 张宁
2017-04-10 15:58
来源:澎湃新闻
10%公司 >
字号

4月10日,中国围棋协会、浙江省体育局和谷歌公司在北京中国棋院共同宣布,谷歌旗下DeepMind公司开发的人工智能AlphaGo将于5月23日至27日,在浙江桐乡乌镇举办的“围棋峰会”上,与柯洁九段对弈。

柯洁在发布会现场。 本文图均为 澎湃新闻记者 张宁 图

届时,AlphaGo除了与目前世界排名第一的柯洁进行三番棋对弈外,还将参加峰会安排的人机配对赛和团体赛。

根据谷歌中国给出的双方对弈时间,在5月23、25、27日,柯洁将与AlphaGo进行三番棋对决,每方3小时,5次1分钟读秒。

5月26日举行的人机配对赛中,古力与连笑将进行对弈,只不过每一方棋手都将有AlphaGo作为自己的队友与他们交替落子,真正体现共同学习的真谛。

5月24日举行的团队赛中,中国五位世界冠军时越、芈昱廷、唐韦星、陈耀烨和周睿羊将组队与AlphaGo进行对弈,建立棋手“神经网络”,降低心理因素的影响,共同测试AlphaGo在面对组合风格时所展现的创造力和适应性。

柯洁扬言:抱必死信念,一定要胜

谷歌大中华区总裁石博盟在发布会上表示:“我们一定要把AlphaGo带到中国来。中国是围棋发源地,有很多优秀棋手,谷歌CEO以及联合创始人都非常支持把阿尔法狗带到中国。AlphaGo引发人们思考——围棋未来将走向何方,人工智能将走向何方。在峰会期间,我们还会举办人工智能论坛,探讨AI技术。”

以柯洁为领队的人类棋手代表团将在5月对阵阿尔法狗。

此次对弈AlphaGo的棋手领队柯洁则在发布会现场直接表决心:“我一定要击败阿尔法狗!”

“AlphaGo很多招法和奇思妙想带给我们很多启发和享受,我半年前得知了这个消息,能与AlphaGo对决是我的荣幸,能够代表人类出战是我无法想象的事情,我会尽我的全力去一争胜负。”柯洁表示:“AlphaGo团队是非常了不起的团队,对我们棋手有非常长远的影响,能够给人类未来带来美好的变化。我站在历史变革的节点上,我不会轻易妥协,不会说人机共赢,我会抱必胜心态、必死信念。我一定要击败阿尔法狗!”

2016年3月,AlphaGo以4比1的总比分击败韩国棋手李世石,引起轰动。赛后,韩国棋院还给AlphaGo颁发了名誉九段证书。当时,柯洁一度“放话”,愿意与AlphaGo过招。

如何训练AlphaGo?

近期,AlphaGo的升级版本以“Master/Magister”的称谓与世界顶级的围棋选手进行了60场史上快棋赛,并取得了全胜的战绩。这一升级为下个月的“过招”更添悬念。

谷歌方面介绍,为了应对围棋的巨大复杂性,AlphaGo采用了一种新颖的机器学习技术,结合了监督学习和强化学习的优势。通过训练形成一个策略网络(policy network),将棋盘上的局势作为输入信息,并对所有可行的落子位置生成一个概率分布。然后,训练出一个价值网络(value network)对自我对弈进行预测,以-1(对手的绝对胜利)到1(AlphaGo的绝对顺利)的标准,预测所有可行落子位置的结果。这两个网络自身都十分强大,而AlphaGo将这两种网络整合进基于概率的蒙特卡罗树搜索(MCTS)中,实现了它真正的优势。最后,新版的AlphaGo产生大量自我对弈棋局,为下一代版本提供了训练数据,此过程循环往复。

AlphaGo整合了强大的策略网络(policy network)和价值网络(value network)。

在获取棋局信息后,AlphaGo会根据策略网络探索哪个位置同时具备高潜在价值和高可能性,进而决定最佳落子位置。在分配的搜索时间结束时,模拟过程中被系统最频繁考察的位置将成为AlphaGo的最终选择。在经过先期的全盘探索和过程中对最佳落子的不断揣摩后,AlphaGo的搜索算法就能在其计算能力之上加入近似人类的直觉判断。

AlphaGo会根据策略网络探索哪个位置同时具备高潜在价值和高可能性,进而决定最佳落子位置。
    澎湃新闻报料:021-962866
    澎湃新闻,未经授权不得转载
    +1
    收藏
    我要举报
            查看更多

            扫码下载澎湃新闻客户端

            沪ICP备14003370号

            沪公网安备31010602000299号

            互联网新闻信息服务许可证:31120170006

            增值电信业务经营许可证:沪B2-2017116

            © 2014-2024 上海东方报业有限公司

            反馈