下载客户端

“阿尔法零”通用棋类人工智能再进化：一日“通杀”3种棋

新华社

2017-12-07 14:58

英国“深度思维”公司最新发布的论文说，该公司一种通用棋类人工智能“阿尔法零”能从零基础开始强化学习，２４小时之内击败了此前最强的国际象棋、日本将棋和围棋人工智能程序，由此前专攻一项技能走向多种技能“通杀”。

“深度思维”公司在最新论文中透露，“阿尔法零”从零开始，通过自我对弈强化学习，约２小时击败日本将棋顶级人工智能程序，４小时击败国际象棋顶级人工智能程序，８小时击败战胜韩国棋手李世石的“阿尔法围棋－李”，并在２４小时内战胜了通过７２小时自我学习训练称王围棋的“阿尔法围棋－零”。

１０月，“阿尔法围棋－零”第一次让人工智能在不“学习”任何既定棋谱、只设定规则的情况下，完全“从零开始”、自我对弈取得飞速进步。而此次的“阿尔法零”在此基础上训练了３种独立的程序，其中国际象棋程序自我对弈４４００万局，日本将棋程序自我对弈２４００万局，围棋对弈了２１００万局。

一些人工智能专家表示，人工智能完全依靠自己摸索，意味着人工智能可以更好地进入对它来说本是一片空白的领域；而“阿尔法零”的问世显示人工智能可以向通用化发展，为诸如开发新药这种与棋类游戏一样有明确规则和目标的问题提供发展蓝图。

（原标题：人工智能再进化　一日“通杀”３种棋）

澎湃新闻报料：021-962866

澎湃新闻，未经授权不得转载

澎湃矩阵

新闻报料

互联网新闻信息服务许可证：31120170006

增值电信业务经营许可证：沪B2-2017116

反馈