澎湃Logo
下载客户端

登录

  • +1

AI打麻将出道!AI“绝艺”成新一代雀神

2023-07-14 18:07
来源:澎湃新闻·澎湃号·湃客
字号

麻将起源于中国,是国粹。虽然各地的麻将玩法各不相同,比如云贵川地区的缺一门打法;广东麻将流行“鸡平和”和“推倒胡”,东北麻将则一门都不能缺......但无论什么玩法都饱受大众喜爱。

要论一个地道的四川人对麻将的喜爱,不能说有瘾,毕竟“竞技场上的事情,怎能说是瘾呢?”

逢年过节不是在牌桌子上,就是在去打牌的路上。

上学“多动症”,打牌“坐如钟”,坐个通宵都是洒洒水。

“我真的不知道为什么打麻将会有瘾,我天天打,也不见得有瘾啊”

“人生最大憾事不过三缺一”

(无非就是以上所描述的此类程度罢了)

在四川要是有人骂你“你打麻将永远三缺一”,大家都会觉得这人骂的是真毒啊!

但是,你或许不知道AI也能打麻将,要是人人都能和AI在牌桌子上一决高下,不仅“三缺一”魔咒不复存在,社恐麻将爱好者也或许能迎来福音,“我社恐,一缺三,来三个AI”(这不是幻想)。

鹅厂AI“绝艺”成新一代雀神

7月11日,腾讯最新消息,旗下棋牌类AI“绝艺”LuckyJ在知名日本麻将平台“天凤”上,刷新AI在麻将领域最好成绩(达稳定段位10.68段)

10.68段是什么概念?天凤则按照1段—11段来进行排位,利用科学的段位和 Elo Rating 体系,根据参与的局数和不断累积的积分,来判定段位。(越是和高水平牌手对局,获胜后 Rate 增加越多,失败后 Rate 减少越少: 越是和低水平牌手对局,获胜后 Rate 增加越少,失败后 Rate 减少越多。)最终段位和 Rate 值的稳定值就代表了牌手的真实实力。

目前,在平台上,7段以上3037人,约占百分之一,而能达到 10 段的只有 27 人(含AI),只占不到万分之一。

(天凤稳定段位bootstrap的分布,绝艺LuckyJ显著强于之前最强的两个日本麻将AI(Suphx,NAGA)LuckyJ vs Suphx p value=0.02883;LuckyJ vs NAGA p value=3e-05)

绝艺LuckyJ不仅达到日本麻将天凤十段,而且之前还在国标麻将线下邀请赛中战胜了6位国标麻将职业选手。成为首个战胜国标麻将顶尖职业选手的麻将AI。

腾讯AI进军麻将

棋牌游戏AI其实早已经不是什么新鲜事了,继象棋,跳棋,围棋之后,AI麻将又一次进入大众视野,但其实AI麻将早在2015年就有发迹。

2015年,东京大学开发的“爆打”,9 月,爆打达到天凤麻雀“四段,12 月一度冲进天凤七段,稳定段位均6段左右。

2018年,Dwango 公司于开发的基于深度学习模型的“NAGA25”,天凤稳定段位均6.5左右。

2019年,微软开发的Suphx于3月登陆天凤,短短几个月内,Suphx在该平台上与人类选手展开了5000余场四人麻将对局,达到了十段,超越了99%人类玩家,这是世界上第一个达到天凤10段水平的人工智能。

至于腾讯的AI“绝艺”,它的开发始于2016年,最早是从围棋起步。那么问题来了,为什么这么长时间,腾讯AI才进军麻将?

一个字——难。

首先,麻将是一个“不完美信息博弈”,共有 136 张牌,除了对手打出来的牌之外,对手的手牌、游戏的底牌、以及对手的牌型组合都是未知的,而围棋、象棋双方在每一次决策前后都能看到全局信息,是“完美信息博弈”。

其次,对战过程中也涉及了大量的决策,麻将的随机性很高,发牌的结果、玩家行为都是随机的,除了正常的摸牌、打牌之外,还要决定是否吃牌、碰牌、杠牌、立直以及是否胡牌,任意一位玩家的吃碰杠都会改变摸牌的顺序。

此外,麻将的牌型非常多,同时每个牌型还有不同的组合方式,还有许多复杂的规则和策略,需要建立一个大规模的知识库。棋牌游戏一直以来都是 AI 技术的优质试验场,而“非完美信息” 游戏存在着大量的隐藏信息,给游戏带来了更高的不确定性,对 AI 的博弈能力提出更高要求,所以麻将AI需要更强大的决策能力。

更大规模的“非完美信息博弈”

麻将相较于围棋、象棋、桥牌以及德州扑克来说是一类更大规模的非完美信息博弈问题。对AI来说具有更大的挑战性,如果说围棋的可观测状态信息是10的172次方,隐藏的不确定信息为0,那么,麻将的可观测状态信息则是10的121次方,隐藏的不确定信息(信息集的平均数)则为10的48次方。

鉴于传统的强化学习针对非完美信息游戏没有收敛到最强策略的理论保证,而有理论保证的遗憾值最小化算法(表格型)计算复杂度太高。腾讯 AI Lab 的研究员提出了一种新型的策略优化算法—ACH(actor critic hedge)采用了基于强化学习和遗憾值最小化的自我博弈技术,使得AI能从零开始自我学习和提高,最终收敛到一个最强的混合策略。同时基于“乐观价值估计的思想”,提出了一种高效的“非完美搜索方法”,使深度强化学习结合非完美信息搜索成为可能。

腾讯称,训练麻将 AI,其实就是在训练 AI 更好地去认识人类的世界。 最终让 AI 解决真实世界的复杂问题。

鹅厂绝艺LuckyJ达日本麻将天凤十段,还战胜了国标麻将职业选手,是目前最强的麻将AI。到这里,不可否认AI已经在麻将领域战胜了人类,但还是有不少网友不买账,

不一定,AI不会没事去杠开,更不会没事七对子。我们玩的不是牌,是信仰

AI读不懂两口子使眼色的牌和女婿急着输给丈母娘的心

如果人类牌手作弊,麻将 AI 则无法战胜人类。

游戏作为生成式 AI 首要试验田,这些或许还只是开端,想要让AI在牌桌子上读懂人类选手的心思,还有很长的路要走,但要是真和AI一起打麻将,输赢可能就不再是人类牌手的执念了(除非你是发哥)毕竟我们玩的真不是牌,是信仰。

但值得思考的是,围棋、麻将之后,下一个会是谁?

原标题:《AI打麻将出道!鹅厂AI“绝艺”成新一代雀神》

阅读原文

    本文为澎湃号作者或机构在澎湃新闻上传并发布,仅代表该作者或机构观点,不代表澎湃新闻的观点或立场,澎湃新闻仅提供信息发布平台。申请澎湃号请用电脑访问http://renzheng.thepaper.cn。

    +1
    收藏
    我要举报

            扫码下载澎湃新闻客户端

            沪ICP备14003370号

            沪公网安备31010602000299号

            互联网新闻信息服务许可证:31120170006

            增值电信业务经营许可证:沪B2-2017116

            © 2014-2024 上海东方报业有限公司

            反馈