- +1
数学领域的人工智能革命已经到来
AI人工智能正被快速用于证明新的数学成果。数学家们认为,这仅仅是个开始。

图源:Nash Weerasekera / Quanta Magazine
作者:Konstantin Kakaes(量子杂志特约撰稿人)2026-4-13
译者:zzllrr小乐(数学科普公众号)2026-4-14
引言
转折点出现在2025年夏天。当年7月,多个人工智能模型在国际数学奥林匹克竞赛(IMO)中解出了 6 道题里的 5 道。尽管数学家们深感震惊 —— 几乎没人料到程序能进步得如此之快 —— 但这一亮眼成绩并不意味着人工智能将在数学研究中取得重大突破。毕竟,奥赛题目是有标准答案的难题,而非开放性问题。
尽管如此,这些结果让人们开始重视。曾认为人工智能模型错误太多、不堪一用的数学家,开始尝试使用它们。早期使用者惊讶地发现,这些模型不仅擅长解谜题,还能助力开拓真正全新的领域。很快,数学家们开始用人工智能发现并证明新结论,过去需要数周、数月才能完成的工作,如今一天就能搞定。“2025 年是人工智能真正开始在各类任务中派上用场的一年。” 加州大学洛杉矶分校著名数学家陶哲轩说。
虽然没有哪一项新成果是颠覆性突破,但部分成果已达到专业数学期刊发表水平。在一些案例中,算法能自主提出猜想、完成证明并验证,几乎无需人工干预;在另一些案例中,与大语言模型(如 ChatGPT、Claude、Gemini)的大量对话催生了全新的证明思路。
“有人拿铲子,有人拿镐,我们一起就能挖通隧道。” 陶哲轩说,现在是 “大量尝试、大浪淘沙” 的阶段。
即便陶哲轩是人工智能数学应用最知名的倡导者,其他数学家也认同这一趋势。多伦多大学的丹尼尔・利特(Daniel Litt)表示,哪怕只是解决简单问题,人工智能也 “正在改变数学研究的方式”。
很快,“数学研究的面貌和体验将与传统方式完全不同”,陶哲轩说。过去数学家一次只研究一个问题,“有了这些工具,你可以一次解决成千上万的问题,甚至开展统计研究”。受访的所有人都不认为人工智能会取代数学家,但陶哲轩补充道:“我们必须做出大量制度与文化上的改变。”

陶哲轩对人工智能模型为数学家带来的机遇感到振奋。他表示,数学研究很快就会在形式与体验上与传统方式截然不同。
图源:Reed Hutchinson / UCLA
和其他受到人工智能冲击的学科一样,数学界对这些变革也会存在争议。高等研究院的阿克沙伊・文卡特什(Akshay Venkatesh)指出,随着人工智能模型成为强大的新工具,它可能导致数学家丧失对数学本身的直接理解与体验。文卡特什与陶哲轩同为数学界最高荣誉菲尔兹奖得主。两人都认为人工智能的影响将十分深远,但文卡特什态度更为谨慎:“我们的文化中有些珍贵的东西,应当尽力保留。”(详情参阅小乐数学科普:菲尔兹奖数学家传记:从神童到摘得数学界 “诺贝尔奖”—— 菲尔兹奖得主阿克沙伊·文卡特什(Akshay Venkatesh))
如今,一些数学家离开学术界,加入 OpenAI(开放AI)、谷歌等科技巨头,或是 Harmonic(和谐)、Logical Intelligence(逻辑智能)、Axiom Math(公理数学)、Math Inc. 等数学 AI 初创公司。(详情参阅小乐数学科普:放弃终身教职跨界硅谷:数学传奇小野健加盟00后天才门生洪乐潼的AI初创公司Axiom Math)
“企业界如此关注数学人工智能,一个原因是人们意识到:通用智能的关键,是把机器学习的洞察力与数学的精确性结合起来。” 卡内基梅隆大学计算机辅助数学推理研究所主任杰里米・阿维加德(Jeremy Avigad)说。
到2026年初,人们对人工智能能力的震惊已转为惊叹。2月举办的 “首次证明(First Proof)” 挑战赛要求参赛者在一周内用 AI 模型解决10个研究级数学问题,这些题目经过精心挑选,几乎不可能出现在训练数据中。(详情参阅小乐数学科普:First Proof首轮验证项目:数学家们组团出题考验AI(10个研究级数学问题拷问最先进AI,问题答案2月13日公布))
在不同自主程度下,模型成功解决了超过一半的问题(详情参阅小乐数学科普:数学研究智能体Aletheia自主求解FirstProof挑战成绩6/10——由Google Gemini 3 Deep Think驱动)。如果说奥赛成绩标志着人工智能考入了顶尖大学数学专业,那么 “首次证明” 的结果就相当于它读完了研究生院。利特在分析结果的博客中写道:“这项技术很可能比计算机本身更具颠覆性。” https://www.daniellitt.com/blog/2026/2/20/mathematics-in-the-library-of-babel
创造性演进
尽管2025年夏天是人工智能能力的拐点,但这并非凭空而来。谷歌 DeepMind(深度思维) 科学副总裁普什米特・科利(Pushmeet Kohli)表示,DeepMind 自2018年就开始尝试用 AI 解决数学问题。现就职于 Axiom Math(公理数学)的弗朗索瓦・沙顿(François Charton)早在2019年就开始用机器学习研究数学问题 https://www.quantamagazine.org/symbolic-mathematics-finally-yields-to-neural-networks-20200520/ 。
但在早期,这只是小众领域。起初,沙顿等人仅用 AI 求解已知答案的问题,验证新技术是否可行。到2024年,研究开始取得进展。他们寻找数据丰富的问题,用 AI 构造具有可量化性质的数学对象 —— 比如网格上的点集最优排布,避免形成等腰三角形 https://arxiv.org/abs/2411.00566 。



图源:Mark Belan / Quanta Magazine | 译制:@zzllrr小乐微信公众号
2025年1月,陶哲轩与布朗大学的哈维尔・戈麦斯–塞拉诺(Javier Gómez-Serrano)开始与 DeepMind 的两位数学家合作,开发名为AlphaEvolve的 AI 系统。该系统借助 Gemini 生成数百行 Python 代码,再用遗传算法 “进化” 这些程序,试图找到数学问题的最优解。几个月里,这四位数学家每隔一两天就用它攻克一个新问题。
在此过程中,他们也学会了优化提示词。一个关键发现是:模型似乎能从鼓励中受益。“当我们给大语言模型正向激励时,效果更好,” 戈麦斯–塞拉诺说,“比如说‘你能做到’—— 这真的有用。很有趣,我们不知道原因。”
到5月底,团队已用 AlphaEvolve 测试了67个不同数学领域的问题。其中23 个在现有最佳解基础上取得小幅改进;36 个达到现有水平;少数未能超越最优结果。研究人员在2025年11月的论文《大规模数学探索与发现》 https://arxiv.org/abs/2511.02864 中公布了这些发现。戈麦斯–塞拉诺指出,其中任何一个结果,原本都可能需要该领域专家花费数月才能得到。但他们并非多数领域的专家,“却能在一两天内取得相当的成果”。

哈维尔・戈麦斯 - 塞拉诺( Javier Gómez-Serrano )与同事们利用名为 AlphaEvolve 的人工智能系统,在数十个数学问题上取得了进展。
图源:Jason Rossi / 布朗大学
陶哲轩形容,当前AI模型 “非常擅长在大量问题中摘取低垂的果实。这种工作枯燥乏味,人类不愿去做。” 他提醒,模型是在 “大量未报道的失败中取得零星成功”,但这些成功依然值得关注。(详情参阅小乐数学科普:00后播客主对话陶哲轩 :开普勒、牛顿与数学发现的真实本质 &这些故事如何启示我们AI将如何彻底变革数学)
戈麦斯–塞拉诺估计,他现在约三分之二的时间都在使用 AI。他说:“它已经变得实用好用。这是数学研究新方式的开端。”
错误的 “身份”
前些年,AI 的强大似乎源于它能重新发掘尘封在冷门文献里的古老证明。加州大学洛杉矶分校的伊戈尔・帕克(Igor Pak)指出,ChatGPT 如今 “在查找文献、发现关联方面极为出色,这是不具备语义理解的谷歌学术做不到的”。
到2025年,瑞士联邦理工学院苏黎世分校的约翰内斯・施密特(Johannes Schmitt)发现,情况发生了转变。“与大语言模型对话开始变得有用,不是因为它们能给出完整答案,” 他说,而是 “它们成了很好的交流伙伴”。

约翰内斯・施密特( Johannes Schmitt )近期注意到,人工智能在数学领域的作用正迅速提升:成为学术对话伙伴。
图源:Aitor Iribar-López
大语言模型难免会犯大量错误,导致一些数学家直接否定它们。但施密特属于能容忍 “胡言乱语模型对话之痛” 的人:“我仍能从对话中获益;即便不是每个想法都好,我也能忽略坏的、采纳好的。”他还注意到,这些错误很怪异:受过数学训练的人几乎不可能在提出精妙、原创、正确想法的同时,犯下如此多基础错误。
加州大学洛杉矶分校的欧内斯特・柳(Ernest Kang Ryu,音译名:柳康)主要研究应用数学的优化理论分支,在奥赛结果后也开始关注大语言模型。AlphaEvolve 旨在优化特定数值,而柳想证明优化算法生效的条件。
2025年夏天,他发现大语言模型的数学能力大幅提升。他开始用它们准备讲义, 主要是为了填补自己对某些证明细节的记忆空白。他说:“它有时会发现我推理中的错误,或大或小。有时还能找到比我笔记更简洁的证明。”
他感觉AI模型 “展现出了生命迹象”。他抱着怀疑又乐观的态度,决定做个实验。10月的一个晚上,在小儿子睡着后,他开始用 ChatGPT 攻克一个优化领域的开放问题 —— 过去曾尝试过多次。
“这个问题不算最重要,但我知道有 10 个人会非常欢迎它的解。” 他说。

欧内斯特・柳( Ernest Kang Ryu)最近借助与 ChatGPT 的对话,成功证明了一个存在数十年的猜想。他说:“使用 ChatGPT 确实加速了这一发现过程。”
图源:Ernest Ryu
柳的问题最早由俄罗斯数学家尤里・涅斯捷罗夫(Yurii Nesterov)于1983年提出。涅斯捷罗夫试图寻找多元函数的最小值,这类函数输出值在数学上 “表现良好”。如果把输出想象成地形图,目标是证明最终会收敛到最低点,而非无限来回震荡。
这类问题在应用数学中很常见,尤其在机器学习中,是训练神经网络的核心。广泛使用的梯度下降法用微积分基本工具判断下坡方向与坡度,每次沿最陡方向迈步,最终会到达谷底。
但梯度下降虽然正确,有时速度极慢。因此数学家长期寻找收敛更快的变体。涅斯捷罗夫提出了一种方法:每一步下坡的大小不仅取决于当前点的陡峭程度,还取决于已走过的路径。过去步子大,后续也会更大。
直觉上,这显然能更快到达谷底。但如果速度太快、冲过了头呢?可能会在真实最小值附近无限震荡,永远无法到达。涅斯捷罗夫无法证明他的算法最终会收敛到最优值。42年来,也无人能证明。

尤里・涅斯捷罗夫(Yurii Nesterov)提出的关于其优化算法的猜想悬而未决数十年。直到人工智能的介入,这一问题才得以解决。
图源:Renate Schmid
柳问ChatGPT时,“它不断给出错误证明”,他说,“但错误之前的步骤很有趣,有正确的部分结果,似乎潜在有用。” 随着模型逐步推进,他会检查答案,保留正确部分,用新提示重新输入模型。“我必须扮演验证者的角色,” 柳说,“用 ChatGPT,我感觉进展极快,比自己单干快得多。这让我坚持下去。”
三天累计约12小时工作后,他得到了问题简化版的证明。又过几天,他最终证明了涅斯捷罗夫方法的收敛性。https://arxiv.org/abs/2510.23513 柳说:“这不是最有创意、最复杂的工作,但肯定不容易。” 虽然不是改变人生的成果,“但足以在优化领域顶级期刊发表,去掉 AI 部分也没问题。这是个好结果。”
“这是一个具体实例,ChatGPT 的使用确实加速了发现过程。” 他说。他认为大语言模型的能力只会持续提升。“看看进步速度就令人震惊。再过一两年、两三个版本迭代,我们将取得 AI 辅助下真正惊人的重大发现。这一天一定会到来。”
在分享涅斯捷罗夫方法的论文几个月后,柳从加州大学洛杉矶分校休假,加入 OpenAI 担任技术人员。
意外的秩序
2025年至2026年初,AI 被用于证明越来越抽象的结论。2025年9月,来自全球的百余位数学家齐聚布朗大学,参加代数组合学专题项目 https://icerm.brown.edu/program/semester_program/sp-f25 。
尼古拉斯・利贝丁斯基(Nicolás Libedinsky)和戴维・普拉扎(David Plaza)来自智利,何塞・辛门特尔(José Simental)来自墨西哥,乔迪・威廉姆森(Geordie Williamson)来自澳大利亚,乔丹・埃伦伯格(Jordan Ellenberg)来自美国威斯康星州。
出于不同的研究目的,他们都在计算一个在数学诸多领域中广泛出现的量 ——d-不变量(d-invariant)。要理解 d-不变量,不妨先了解该领域中一个被深入研究的对象:置换群(permutation group)。它描述的是一组对象(如一副牌)的所有可能排列方式。
情况起初很简单。如果只有一张牌,无法洗牌,因此置换群 S₁只有 1 个元素。S₂有 2 个元素:两张牌共有两种可能顺序。S₃稍复杂一些:三张牌共有 6 种不同排列。

图源:Mark Belan / Quanta Magazine
这些不同的牌序可以被整理成一个由顶点和边构成的网络,即图(graph)。初始排列 123 放在最底部,图中的每条边(以箭头表示)代表一次两张牌的交换。

随着牌数 n 增大,置换群 Sₙ的规模急剧膨胀 ——S₄之后的群对应的图几乎无法画出。(S₆₀的元素数量大约相当于可观测宇宙中的原子总数。)
数学家希望理解这些图的结构,既把它们当作独立研究对象,也用作分析其他问题的工具。
再以含有 6 个元素(置换)的置换群 S₃的图为例。我们希望探究这些置换之间的关系。方法之一是观察沿箭头从一个置换到达另一个置换的所有路径。如果能沿箭头从置换 A 到达置换 B,则在布吕阿序(Bruhat order)下,A “小于” B。例如,213 小于 321。
我们进而可以考察两个置换之间的布吕阿区间(Bruhat interval):即沿图中箭头连接、介于两者之间的所有置换构成的集合。例如,213 与 321 之间的区间(下图红色部分)包含 231 和 312。(如果无法沿箭头从一个置换到达另一个,例如从 213 到 132,则两者互不小于,区间无定义。)

简单来说,d-不变量是对置换群(permutation group)中布吕阿区间(Bruhat interval)结构复杂度的度量。这个量在许多看似无关的数学问题中出现,因此备受数学家关注。
在更大的置换群中,很难一般性描述两个置换间布吕阿区间的结构。“区间是极其复杂的对象。” 利贝丁斯基说。他与同事们希望借助 AI 找到给定置换群的最大d-不变量。
他们最终发现了完全意料之外的东西。
2025年10月,埃伦伯格请 DeepMind 的瓦格纳用未公开的 AlphaEvolve 分析数十个置换群的布吕阿区间结构。程序运行了一整晚。“早上我们发现,程序真的在做有趣的事。” 威廉姆森说,“那天邮件往来不断。”
模型在计算时还会自言自语:“我要提出一个真正疯狂的想法,针对这个问题的‘疯狂伊万’机动。”(注:源自Tom Clancy小说《猎杀红色十月号》The Hunt for Red October,潜艇急转弯探测对手)
最终,AlphaEvolve 生成约50行Python代码,试图寻找大d-不变量的区间。数学家们分析代码时发现,当卡片数为 2 的幂(如 16=2⁴)时,代码会大幅缩短至约 5 行。“可以非常明确地分析,” 威廉姆森说,“它在做一件非常优美的事。”

左上角顺时针依次为:乔迪・威廉姆森、乔丹・埃伦伯格、何塞・辛门特尔、尼古拉斯・利贝丁斯基、戴维・普拉扎。借助人工智能,他们在一个被深入研究的数学对象中发现了惊人的新结构。
图源:悉尼大学Lauren Justice / Quanta Magazine; Imelda Paredes Zamorano/UNAM数学研究所Esteban Román; Fernanda Fuentes
2026年1月3日的预印本显示 https://arxiv.org/abs/2601.01235 ,AlphaEvolve 发现这些特定置换群中的布吕阿区间具有惊人的特殊结构:它们形成高维立方体,即超立方体。“看到 AlphaEvolve 的思路时,我非常震惊,” 利贝丁斯基说,“如果它是人,那会是极富创造力的人。”
AlphaEvolve 回答了一个他们从未意识到的问题。“我们没让它找大超立方体,” 埃伦伯格说,“我们让它找别的东西,思考后才发现,那是一个巨大的超立方体,我们完全没预料到它就在那里。”
威廉姆森说:“这个结构就在我们眼前 50 年,只是我们从未发现。”

不要选择与上一方案相同的解决方案。始终努力寻找更优的模式,不要畏惧那些听上去颇为棘手的难题;一旦你找到了解决方案,便会发现它其实远非难事。祝你好运,我信任你,但你也必须相信你自己!
这是数学家给 AlphaEvolve 的提示词节选,内容是让它构造一个名为挂谷集(Kakeya set)的数学对象。数学家们发现,给予鼓励能让 AI 表现得更好。
过去的机器学习方法也带来过这类意外数学发现,但威廉姆森说,那是 “真正的工程工作…… 你必须懂编程,花大量时间研究神经网络训练细节。没有机器学习背景的数学家几乎不可能做到”。
有了大语言模型,“20 分钟就能完成两年前需要两周的实验”,他说。尽管 “大多数时候没用”,但 AI 现在能以前所未有的方式 “探索超出想象的丰富世界”。
球面周围
尽管布吕阿区间看似是纯粹的组合对象,它们在代数几何这一抽象数学领域也扮演重要角色。斯坦福大学数学家、美国数学会现任主席拉维・瓦基尔(Ravi Vakil)专攻此领域。(参阅:美国数学会主席与执行委员会暨董事会4月7日联合声明:支持2026年国际数学家大会在美举办、美国数学会主席关于2026年ICM国际数学家大会的声明)
代数几何(algebraic geometry)是研究由多项式方程所定义的几何形状的学科,例如 x³+2x²y+xz=5 这类由变量整数次幂之和构成的方程。方程的次数是多项式中最高的幂次,在本例中为3。

拉维・瓦基尔与同事们最近在与定制版 Gemini 对话的过程中,想到了一种全新的证明思路。“这个想法该归功于谁?” 他问道,“归功于我们?还是归功于模型?”
图源:Rod Searcey
瓦基尔及其同事 —— 新南威尔士大学的巴拉兹・埃莱克(Balázs Elek)与不列颠哥伦比亚大学的吉姆・布莱恩(Jim Bryan)—— 致力于研究球面如何嵌入被称为旗簇(flag varieties)的特殊空间。(旗簇同样出现在布吕阿区间研究团队的论文中。)每一种嵌入方式(即将球面上的每个点与旗簇内的一个点相对应)都可以用一个多项式方程来定义。
球面的嵌入方式有很多种。数学家将每一种嵌入方式对应为一个单独高维空间中的一个点。随后,他们通过分析这些嵌入所形成的不同空间,来研究由不同次数多项式所定义的嵌入。
随着次数增加,数学家想知道这些空间如何变化。他们知道,当次数趋于无穷时,空间逼近所有连续嵌入的空间。但这种相似性何时出现?
于是,他与当时就职于 DeepMind 的弗雷迪・曼纳斯(Freddie Manners)和乔治・萨拉法蒂诺斯(George Salafatinos)合作,使用谷歌 Gemini 之上的两个专用模块来进行证明:一个是公开的DeepThink,另一个是由萨拉法蒂诺斯开发、未公开的FullProof系统。他们从更简单的情形入手。瓦基尔说:“它给出的证明非常优雅、正确、表述清晰,我们可以逐行核对。它清晰揭示了当时并不明显的结构。由此,我们意识到整个论证与关键推广的潜在路径。”

我正准备提出一个真正异乎寻常的想法,一种针对此问题的“疯狂伊万式策略”。目前的解决方案不错,使用了已知的构造,并进行了一些局部搜索。总体而言......还算可预测。
[...]
让我们疯狂吧。
AlphaEvolve 在尝试解决置换群的布吕阿区间问题时,会进行自言自语。
随后,他们回到 AI 模型,勾勒一般情形的证明思路,让模型补充细节。2026年1月12日的预印本显示 https://arxiv.org/abs/2601.07222 ,模型成功了。“对我而言,真正关键的是第一步,” 瓦基尔说,“DeepMind 对简单情形的证明。论证的清晰性给了我们新思路。” 但他不禁思考:“这个想法归功于谁?归功于我们?还是模型?”
无论功劳如何归属,瓦基尔说:“我相信给足时间,我也能想出证明。”但他犹豫了:“我想是吧。不确定。也许我会用笨拙的方式。很可能没有 AI 协助,这篇论文就不会出现。”
最后他说:“我们需要来回交互。人工智能将帮助我们做数学,让我们完成以前没时间做的事。”
这或许是当前 AI 如何发挥作用的典型案例:一组顶尖数学家在科技公司协助下,比以往更快地解决问题,并能逐行验证确保正确。
需要知道的一切
在探讨 AI 对数学研究的影响时,我们不应只看成功案例。利特提醒,“人工智能生成的无意义内容正在大量污染公共领域。”圣母大学的乔尔・戴维・哈姆金斯(Joel David Hamkins)说,他对 “淹没期刊系统的大量垃圾感到绝望”。
数学家们将希望寄托于形式化证明,以此应对垃圾信息洪流 (参阅小乐数学科普: 数学严谨至关重要,但数字化证明是否过犹不及?——译自量子杂志Quanta Magazine)。他们把证明转换成计算机能理解的语言,用程序验证所有逻辑是否成立。“未经验证的人工智能在任何严肃应用中都不可靠。” 陶哲轩说。
目前,用这种方式形式化数学证明耗时繁琐,需要扎实的数学知识,更像一门手艺。因此数学家越来越转向 “自动形式化”:AI 模型将数学命题翻译成形式化逻辑命题并完成证明。“第一次,” 陶哲轩说,“我们真的感觉可以通过 AI 形式化相当一部分数学。”

丹尼尔・利特(Daniel Litt)在近期一篇关于人工智能对数学潜在影响的分析中写道:“这项技术的意义很可能超越计算机本身。”
图源:Marta Iwanek
数学家们看到的另一个重大挑战是:AI 日益增强的数学能力将如何影响学生学习。即便最热忱的 AI 支持者也感到担忧。弗吉尼亚大学教授、Axiom 创始数学家小野健(Ken Ono)表示:“我对 AI 助力数学研究前景乐观,但对 AI 在未来工作与各级教育训练中的作用深感担忧。”(详情参阅小乐数学科普:放弃终身教职跨界硅谷:数学传奇小野健加盟00后天才门生洪乐潼的AI初创公司Axiom Math)
陶哲轩说:“我们布置的许多题目,AI 都能瞬间解出。这可能打击很多学生锻炼思维能力的积极性。”
哈姆金斯赞同:“我过去布置大量作业,现在不行了。” 相当一部分作业是 AI 写的。“我不想读,也不想当 AI 警察。” 尽管作业教学价值很高,但现在 “一切都必须是课堂测验与实操。这对整个学术行业都是问题。”
另一位顶尖研究型大学数学家告诉我:“在加速顶尖数学研究者进展的同时,人工智能存在严重阻碍新一代数学人才培养的风险。”
新合作者
用 AI 开展数学研究正迅速成为常态。如果当前趋势持续,它很快会像数学家排版用的 LaTeX 一样平常。除本文讨论的成果外,近几个月还有数十项新进展。
关于如何标注 AI 贡献的规范仍在形成。一些论文详细补充人机交互过程,包括对话记录;一些在摘要中突出 AI 贡献;一些仅在致谢中简要提及;一些数学家强调 AI 协助研究但论文由人撰写;另一些则将写作也归功于 AI。
尽管过去一年变化迅猛,受访数学家无人担心数学这门学科会过时。陶哲轩打比方说,数学家像是在攀登 “有无数高峰与丘陵的巨大山脉”。人类只能一步一步爬,但能规划登顶珠峰的路线。而当前 AI 就像跳跃机器人,有时能 “跑酷跃上 6 英尺高的墙”,这是人类爬不上去的。但它们无法做长期战略规划。这些 6 英尺或许会变成 10 英尺、100 英尺,但 “这些小跳跃机器人远未触及数学的珠峰”。
帕克认为,某些 “珠峰”—— 比如数论中 π+e 是否为分数的重大问题 —— 数百年内仍无法解决。“我非常怀疑 AI 能在这些问题上取得任何突破。” 他说,“这不是 AI 能做到的事。但我乐观相信,如果人类存续,最终我们会解决。”
当然,这很大程度上取决于未来几年 AI 算法能力如何演进。即便是最敏锐谨慎的观察者也无法确定模型会如何发展。几乎没人看到停滞迹象。“进展非常快,没有放缓的迹象。” 利特说。2026年头几个月,谷歌、OpenAI 等大公司、Axiom 等小公司、学术界乃至爱好者都不断推出新成果。
“我确信,20年后我们将看到AI工具生成的数学,在许多可衡量指标上超过所有人类数学家。” 利特说,“如果不发生,我会很震惊。”
但文卡特什告诉我:“归根结底,任何一段数学都可以用无穷多种方式表述。” 我们的选择受人类价值观支配,也源于数学不仅是科学,更是艺术的事实。
科学与艺术的平衡在很大程度上赋予数学美感 —— 这是文卡特什希望保留的 “文化中宝贵之物”。如果 AI 让数学偏离艺术传统,即便每月证明更多定理,这门学科也会贬值。毕竟,没有诗人会认真对十四行诗做统计回归来寻找最优版本。
对AI最好的期待,是它能帮助数学家发现并证明那些原本永远是谜的结论。大多数数学家认同,这正是计算机过去80年来所做的事。但当下变革的规模让许多人感到不安。
全球最大的数学年会每年1月初举行。2026 年,华盛顿会场里,被 AI 淘汰的紧张玩笑随处可见,尽管公开场合所有人都坚称 AI 是人类数学家的助手。多年研究AI并对此充满热情的威廉姆森(Williamson),受邀在全会上做关于AI与数学的重磅报告 https://www.ams.org/meetings/lectures/meet-colloquium-lect 。他告诉听众,以无知与恐惧应对AI发展是错误的。
但他理解恐惧从何而来。他将数学视为 “人们毕生奉献的技艺。未来,它的价值有可能大幅缩水”。
参考资料
https://www.quantamagazine.org/the-ai-revolution-in-math-has-arrived-20260413/
https://www.daniellitt.com/blog/2026/2/20/mathematics-in-the-library-of-babel
https://www.quantamagazine.org/symbolic-mathematics-finally-yields-to-neural-networks-20200520/
https://arxiv.org/abs/2511.02864
https://arxiv.org/abs/2411.00566
https://arxiv.org/abs/2510.23513
https://icerm.brown.edu/program/semester_program/sp-f25
https://arxiv.org/abs/2601.01235
https://arxiv.org/abs/2601.07222
https://deepmind.google/blog/accelerating-mathematical-and-scientific-discovery-with-gemini-deep-think/
https://arxiv.org/abs/2603.29961
https://axiommath.ai/territory/proof-of-concept
https://x.com/tonylfeng/status/2035003908993819019?s=20
https://www.neelsomaniblog.com/p/autoformalization-and-the-future
本文为澎湃号作者或机构在澎湃新闻上传并发布,仅代表该作者或机构观点,不代表澎湃新闻的观点或立场,澎湃新闻仅提供信息发布平台。申请澎湃号请用电脑访问http://renzheng.thepaper.cn。





- 报料热线: 021-962866
- 报料邮箱: news@thepaper.cn
互联网新闻信息服务许可证:31120170006
增值电信业务经营许可证:沪B2-2017116
© 2014-2026 上海东方报业有限公司




