澎湃Logo
下载客户端

登录

  • +1

腾讯“绝艺”全胜战绩夺世界围棋AI冠军,曾对柯洁13连胜

澎湃新闻记者 王心馨
2017-03-20 08:42
来源:澎湃新闻
能见度 >
字号

3月19日,第10届日本UEC杯计算机围棋大赛在日本东京都日本电气通信大学(UEC)落幕,腾讯人工智能实验室(腾讯AI Lab)研发的围棋人工智能程序“绝艺”(英文名:FineArt) 在最终的决赛中,战胜了日本“棋手”DeepZenGO,以11战全胜战绩获得这次比赛冠军。

“绝艺”战胜DeepZenGO

UEC杯始创于2007年,与普通围棋赛不同,参赛选手不是人类,而是人工智能,每年在日本举行,是最具传统和权威的计算机围棋大赛。UEC杯每年邀请各国高水平AI齐聚东京比赛,促进相关学术及科技的交流。日本的DeepZenGo、法国的“疯石”(Crazy Stone)、美国Facebook公司的“黑暗森林”(Dark Forest)等著名计算机围棋程序曾先后在UEC杯折桂获奖。

比赛现场

说到围棋AI比赛,必定绕不开曾战胜过人类棋手李世石的AlphaGo。不过,据澎湃新闻了解,此次DeepMind公司的AlphaGo团队与去年一样,并未选择参赛。

“绝艺”背后的人工智能

据腾讯介绍,“绝艺”的名字取自唐代诗人杜牧的送别诗《重送绝句》:“绝艺如君天下少,闲人似我世间无。别后竹窗风雪夜,一灯明暗覆吴图。”为了开发围棋人工智能,腾讯人工智能实验室组建了一支13人的团队,花了近一年的时间打造“绝艺”。

“绝艺”现场比赛图

“很高兴绝艺能够在UEC杯夺冠,这是非常难得的宝贵经验。绝艺不同于其他实验室AI,它得益于世界超一流棋手的指导,通过不断与高手交流及学习,一步步成长起来。我们希望,通过绝艺能够让更多人关注、喜爱进而传承围棋这一传统文化。”腾讯公司副总裁、腾讯AI Lab负责人姚星在赛后接受媒体采访时说。

腾讯AI Lab负责人姚星在赛后接受媒体采访

“绝艺”的研发始于2016年1月。当时姚星在腾讯内部给工程师发了一条消息:有没有信心做围棋AI,如果围棋不行,先做象棋AI也行。

随后,腾讯人工智能实验室高级总监、专家工程师刘永升经过调研,在2016年3月做出了第一个DEMO(测试版)。到2016年3月下旬,腾讯内部围棋AI正式立项,项目名称weigo。不过那时,AlphaGo已经以4:1的成绩战胜了韩国棋手李世石。

关于AlphaGo背后的算法,Facebook“黑暗森林”围棋软件的开发者田渊栋曾介绍过,AlphaGo这个系统主要由四个部分组成:一是走棋网络,给定当前局面,预测/采样下一步的走棋;二是快速走子,目标和第一步一样,但在适当牺牲走棋质量的条件下,速度要比第一步快1000倍;三是估值网络,给定当前局面,估计是白胜还是黑胜;四是蒙特卡洛树搜索,研发者将游戏中所有的可能性表示成一棵树,树的第N层就代表着游戏中的第N步。树的node(节点)数是随着树的深度成指数增长的,不考虑剪枝,每个node都需要进行估值。把以上这4个部分连起来,形成一个完整的系统。

AlphaGo之后,Crazy Stone、DeepZenGo等纷纷在自己的程序中加入了深度学习模块。腾讯推出的“绝艺”也采用了相似的策略。据腾讯官方介绍,“绝艺”的算法基于策略网络与价值网络两大核心,并提升了价值网络的精度。

除了背后算法相似外,“绝艺”也采取了AlphaGo曾经使用的训练策略,即学习了大量的人类棋谱,又进行了自我博弈学习,以及通过与人类选手对战,增加自己的“战斗经验值”。

2016年11月,“绝艺”正式登录腾讯围棋(野狐围棋)平台,在与多名人类一线顶尖棋手过招后,绝艺曾闭关过一段时间,在大幅度提升了价值网络的精度后,一度以刑天的ID再度亮相。

“绝艺”在腾讯围棋平台上的战绩。 腾讯 图

根据腾讯围棋(野狐围棋)提供的数据,截至2017年3月9日,“绝艺”与柯洁、古力、聂卫平、范廷钰、时越、井山裕太、朴廷桓、元晟溱等共计超过100位知名人类棋手有过交锋,在509局对局中“绝艺”388胜121负,胜率达76.23%。“绝艺”执白的对局有259局,其胜率达到71.43%,“绝艺”执黑的对局有250局,其胜率达81.2%。

具体到个人对弈结果,“绝艺”与柯洁对弈21局,“绝艺”取得16胜5负的战绩。其中柯洁曾拿到过4连胜,而“绝艺”则取得过对柯洁的13连胜,其中“绝艺”执白7局取得5局胜利,“绝艺”执黑14场取得11局的胜利。“绝艺”与第18届农心杯的终结者、中国名将范蕴若共对弈38局,范蕴若胜12局负26局,胜率为31.6%。

“绝艺”与人类棋手的对弈结果。 腾讯 图

结束UEC杯比赛后,3月26日,“绝艺”还将参加由UEC杯衍生出的“电圣战”。“电圣战”是由UEC杯的胜出者,对阵人类顶尖棋手,由日本棋院与电气通信大学于2013年创办。届时,“绝艺”将挑战日本新锐棋手一力辽。

冠军背后是计算资源的较量

在今年的UEC杯比赛中,共有30位人工智能“棋手”参赛。3月18日预赛,采用循环积分赛制,“绝艺”以7局全胜战绩进入16强。3月19日决赛,采用淘汰制,“绝艺”以4连胜的成绩战胜日本DeepZenGo获冠军。

“绝艺”预赛战绩

UEC杯比赛用时每方30分钟,平均下来20秒左右就要落子,因此参赛程序的计算能力对比赛成绩有着至关重要的作用。根据赛制,UEC杯对硬件配置没有强制性要求,比赛时并不是所有的程序都使用统一的硬件配置。虽然要求参赛者必须报告机器功耗,但特别说明功率在1000W以上的,可以通过特别许可参赛。

比赛过程中,各家人工智能“棋手”通过手里的笔记本电脑,把比赛数据发送到各自的服务器计算平台上进行比赛。有意思的是,因为需要联网发送数据,在3月18日的比赛过程中,还发生了因为断网而导致比赛暂停的情况。

UEC杯的快棋赛制其实是对人工智能“棋手”背后计算资源的考验。“绝艺”的背后是腾讯,而DeepZenGo由日本公司DWANGO提供背后支持,DWANGO也是日本著名视频网站NICONICO动画的母公司。得益于各自团队的强大支持,“绝艺”和DeepZenGo两者在预赛中一路过关斩将,并没有遭遇什么抵抗就打进了决赛。决赛中两位对手的交锋成为此届比赛的最大看点。

下围棋并非AlphaGo的最终目的

2016年年初,DeepMind在《自然》杂志上发表的关于AlphaGo的论文,介绍了围棋人工智能背后的算法。此后,许多人工智能围棋程序的开发都基于AlphaGo的研究。换句话说,“绝艺”、DeepZenGo等都是去年那个AlphaGo的跟随者。

不过,现在的AlphaGo已经不再是当初的那个AlphaGo了。从2016年12月29日晚起,升级后的AlphaGo改名为“Master”、接连“踢馆”著名在线围棋网站弈城网和野狐网。截至2017年1月4日,Master斩获了60连胜,击败15位世界冠军,其中包括中国、韩国、日本各自的“当今第一人”柯洁、朴廷桓和井山裕太。

斩获60连胜后,DeepMind联合创始人之一戴密斯·哈撒比斯(Demis Hassabis)更是在推特上激动发声:“在非正式测试结束后,我们期待在今年安排一些标准时长的正式比赛”。此前有媒体报道,今年4月份,中国棋手柯洁将有机会在乌镇与AlphaGo进行比赛。

但对于AlphaGo的母公司DeepMind而言,参加围棋比赛并不是其开发AlphaGo的最终目的。DeepMind公司曾公布过自己2017年的三大目标:实现算法突破,提升社会影响,建立伦理规范。利用AlphaGo背后的算法发掘出可以运用于社会福祉的新科学知识,由此来解决人类的气候、能源和医疗健康等问题。

    澎湃新闻报料:021-962866
    澎湃新闻,未经授权不得转载
    +1
    收藏
    我要举报

            扫码下载澎湃新闻客户端

            沪ICP备14003370号

            沪公网安备31010602000299号

            互联网新闻信息服务许可证:31120170006

            增值电信业务经营许可证:沪B2-2017116

            © 2014-2024 上海东方报业有限公司

            反馈