下载客户端

数学领域的人工智能革命已经到来

2026-04-15 17:22

来源：澎湃新闻·澎湃号·湃客

听全文

AI人工智能正被快速用于证明新的数学成果。数学家们认为，这仅仅是个开始。

图源：Nash Weerasekera / Quanta Magazine

作者：Konstantin Kakaes（量子杂志特约撰稿人）2026-4-13

译者：zzllrr小乐（数学科普公众号）2026-4-14

引言

转折点出现在2025年夏天。当年7月，多个人工智能模型在国际数学奥林匹克竞赛（IMO）中解出了 6 道题里的 5 道。尽管数学家们深感震惊 —— 几乎没人料到程序能进步得如此之快 —— 但这一亮眼成绩并不意味着人工智能将在数学研究中取得重大突破。毕竟，奥赛题目是有标准答案的难题，而非开放性问题。

尽管如此，这些结果让人们开始重视。曾认为人工智能模型错误太多、不堪一用的数学家，开始尝试使用它们。早期使用者惊讶地发现，这些模型不仅擅长解谜题，还能助力开拓真正全新的领域。很快，数学家们开始用人工智能发现并证明新结论，过去需要数周、数月才能完成的工作，如今一天就能搞定。“2025 年是人工智能真正开始在各类任务中派上用场的一年。” 加州大学洛杉矶分校著名数学家陶哲轩说。

虽然没有哪一项新成果是颠覆性突破，但部分成果已达到专业数学期刊发表水平。在一些案例中，算法能自主提出猜想、完成证明并验证，几乎无需人工干预；在另一些案例中，与大语言模型（如 ChatGPT、Claude、Gemini）的大量对话催生了全新的证明思路。

“有人拿铲子，有人拿镐，我们一起就能挖通隧道。” 陶哲轩说，现在是 “大量尝试、大浪淘沙” 的阶段。

即便陶哲轩是人工智能数学应用最知名的倡导者，其他数学家也认同这一趋势。多伦多大学的丹尼尔・利特（Daniel Litt）表示，哪怕只是解决简单问题，人工智能也 “正在改变数学研究的方式”。

很快，“数学研究的面貌和体验将与传统方式完全不同”，陶哲轩说。过去数学家一次只研究一个问题，“有了这些工具，你可以一次解决成千上万的问题，甚至开展统计研究”。受访的所有人都不认为人工智能会取代数学家，但陶哲轩补充道：“我们必须做出大量制度与文化上的改变。”

陶哲轩对人工智能模型为数学家带来的机遇感到振奋。他表示，数学研究很快就会在形式与体验上与传统方式截然不同。

图源：Reed Hutchinson / UCLA

和其他受到人工智能冲击的学科一样，数学界对这些变革也会存在争议。高等研究院的阿克沙伊・文卡特什（Akshay Venkatesh）指出，随着人工智能模型成为强大的新工具，它可能导致数学家丧失对数学本身的直接理解与体验。文卡特什与陶哲轩同为数学界最高荣誉菲尔兹奖得主。两人都认为人工智能的影响将十分深远，但文卡特什态度更为谨慎：“我们的文化中有些珍贵的东西，应当尽力保留。”（详情参阅小乐数学科普：菲尔兹奖数学家传记：从神童到摘得数学界 “诺贝尔奖”—— 菲尔兹奖得主阿克沙伊·文卡特什（Akshay Venkatesh））

如今，一些数学家离开学术界，加入 OpenAI（开放AI）、谷歌等科技巨头，或是 Harmonic（和谐）、Logical Intelligence（逻辑智能）、Axiom Math（公理数学）、Math Inc. 等数学 AI 初创公司。（详情参阅小乐数学科普：放弃终身教职跨界硅谷：数学传奇小野健加盟00后天才门生洪乐潼的AI初创公司Axiom Math）

“企业界如此关注数学人工智能，一个原因是人们意识到：通用智能的关键，是把机器学习的洞察力与数学的精确性结合起来。” 卡内基梅隆大学计算机辅助数学推理研究所主任杰里米・阿维加德（Jeremy Avigad）说。

到2026年初，人们对人工智能能力的震惊已转为惊叹。2月举办的 “首次证明（First Proof）” 挑战赛要求参赛者在一周内用 AI 模型解决10个研究级数学问题，这些题目经过精心挑选，几乎不可能出现在训练数据中。（详情参阅小乐数学科普：First Proof首轮验证项目：数学家们组团出题考验AI（10个研究级数学问题拷问最先进AI，问题答案2月13日公布））

在不同自主程度下，模型成功解决了超过一半的问题（详情参阅小乐数学科普：数学研究智能体Aletheia自主求解FirstProof挑战成绩6/10——由Google Gemini 3 Deep Think驱动）。如果说奥赛成绩标志着人工智能考入了顶尖大学数学专业，那么 “首次证明” 的结果就相当于它读完了研究生院。利特在分析结果的博客中写道：“这项技术很可能比计算机本身更具颠覆性。” https://www.daniellitt.com/blog/2026/2/20/mathematics-in-the-library-of-babel

创造性演进

尽管2025年夏天是人工智能能力的拐点，但这并非凭空而来。谷歌 DeepMind（深度思维）科学副总裁普什米特・科利（Pushmeet Kohli）表示，DeepMind 自2018年就开始尝试用 AI 解决数学问题。现就职于 Axiom Math（公理数学）的弗朗索瓦・沙顿（François Charton）早在2019年就开始用机器学习研究数学问题 https://www.quantamagazine.org/symbolic-mathematics-finally-yields-to-neural-networks-20200520/ 。

但在早期，这只是小众领域。起初，沙顿等人仅用 AI 求解已知答案的问题，验证新技术是否可行。到2024年，研究开始取得进展。他们寻找数据丰富的问题，用 AI 构造具有可量化性质的数学对象 —— 比如网格上的点集最优排布，避免形成等腰三角形 https://arxiv.org/abs/2411.00566 。

图源：Mark Belan / Quanta Magazine | 译制：@zzllrr小乐微信公众号

2025年1月，陶哲轩与布朗大学的哈维尔・戈麦斯–塞拉诺（Javier Gómez-Serrano）开始与 DeepMind 的两位数学家合作，开发名为AlphaEvolve的 AI 系统。该系统借助 Gemini 生成数百行 Python 代码，再用遗传算法 “进化” 这些程序，试图找到数学问题的最优解。几个月里，这四位数学家每隔一两天就用它攻克一个新问题。

在此过程中，他们也学会了优化提示词。一个关键发现是：模型似乎能从鼓励中受益。“当我们给大语言模型正向激励时，效果更好，” 戈麦斯–塞拉诺说，“比如说‘你能做到’—— 这真的有用。很有趣，我们不知道原因。”

到5月底，团队已用 AlphaEvolve 测试了67个不同数学领域的问题。其中23 个在现有最佳解基础上取得小幅改进；36 个达到现有水平；少数未能超越最优结果。研究人员在2025年11月的论文《大规模数学探索与发现》 https://arxiv.org/abs/2511.02864 中公布了这些发现。戈麦斯–塞拉诺指出，其中任何一个结果，原本都可能需要该领域专家花费数月才能得到。但他们并非多数领域的专家，“却能在一两天内取得相当的成果”。

哈维尔・戈麦斯 - 塞拉诺（ Javier Gómez-Serrano ）与同事们利用名为 AlphaEvolve 的人工智能系统，在数十个数学问题上取得了进展。

图源：Jason Rossi / 布朗大学

陶哲轩形容，当前AI模型 “非常擅长在大量问题中摘取低垂的果实。这种工作枯燥乏味，人类不愿去做。” 他提醒，模型是在 “大量未报道的失败中取得零星成功”，但这些成功依然值得关注。（详情参阅小乐数学科普：00后播客主对话陶哲轩：开普勒、牛顿与数学发现的真实本质 &这些故事如何启示我们AI将如何彻底变革数学）

戈麦斯–塞拉诺估计，他现在约三分之二的时间都在使用 AI。他说：“它已经变得实用好用。这是数学研究新方式的开端。”

错误的 “身份”

前些年，AI 的强大似乎源于它能重新发掘尘封在冷门文献里的古老证明。加州大学洛杉矶分校的伊戈尔・帕克（Igor Pak）指出，ChatGPT 如今 “在查找文献、发现关联方面极为出色，这是不具备语义理解的谷歌学术做不到的”。

到2025年，瑞士联邦理工学院苏黎世分校的约翰内斯・施密特（Johannes Schmitt）发现，情况发生了转变。“与大语言模型对话开始变得有用，不是因为它们能给出完整答案，” 他说，而是 “它们成了很好的交流伙伴”。

约翰内斯・施密特（ Johannes Schmitt ）近期注意到，人工智能在数学领域的作用正迅速提升：成为学术对话伙伴。

图源：Aitor Iribar-López

大语言模型难免会犯大量错误，导致一些数学家直接否定它们。但施密特属于能容忍 “胡言乱语模型对话之痛” 的人：“我仍能从对话中获益；即便不是每个想法都好，我也能忽略坏的、采纳好的。”他还注意到，这些错误很怪异：受过数学训练的人几乎不可能在提出精妙、原创、正确想法的同时，犯下如此多基础错误。

加州大学洛杉矶分校的欧内斯特・柳（Ernest Kang Ryu，音译名：柳康）主要研究应用数学的优化理论分支，在奥赛结果后也开始关注大语言模型。AlphaEvolve 旨在优化特定数值，而柳想证明优化算法生效的条件。

2025年夏天，他发现大语言模型的数学能力大幅提升。他开始用它们准备讲义，主要是为了填补自己对某些证明细节的记忆空白。他说：“它有时会发现我推理中的错误，或大或小。有时还能找到比我笔记更简洁的证明。”

他感觉AI模型 “展现出了生命迹象”。他抱着怀疑又乐观的态度，决定做个实验。10月的一个晚上，在小儿子睡着后，他开始用 ChatGPT 攻克一个优化领域的开放问题 —— 过去曾尝试过多次。

“这个问题不算最重要，但我知道有 10 个人会非常欢迎它的解。” 他说。

欧内斯特・柳（ Ernest Kang Ryu）最近借助与 ChatGPT 的对话，成功证明了一个存在数十年的猜想。他说：“使用 ChatGPT 确实加速了这一发现过程。”

图源：Ernest Ryu

柳的问题最早由俄罗斯数学家尤里・涅斯捷罗夫（Yurii Nesterov）于1983年提出。涅斯捷罗夫试图寻找多元函数的最小值，这类函数输出值在数学上 “表现良好”。如果把输出想象成地形图，目标是证明最终会收敛到最低点，而非无限来回震荡。

这类问题在应用数学中很常见，尤其在机器学习中，是训练神经网络的核心。广泛使用的梯度下降法用微积分基本工具判断下坡方向与坡度，每次沿最陡方向迈步，最终会到达谷底。

但梯度下降虽然正确，有时速度极慢。因此数学家长期寻找收敛更快的变体。涅斯捷罗夫提出了一种方法：每一步下坡的大小不仅取决于当前点的陡峭程度，还取决于已走过的路径。过去步子大，后续也会更大。

直觉上，这显然能更快到达谷底。但如果速度太快、冲过了头呢？可能会在真实最小值附近无限震荡，永远无法到达。涅斯捷罗夫无法证明他的算法最终会收敛到最优值。42年来，也无人能证明。

尤里・涅斯捷罗夫（Yurii Nesterov）提出的关于其优化算法的猜想悬而未决数十年。直到人工智能的介入，这一问题才得以解决。

图源：Renate Schmid

柳问ChatGPT时，“它不断给出错误证明”，他说，“但错误之前的步骤很有趣，有正确的部分结果，似乎潜在有用。” 随着模型逐步推进，他会检查答案，保留正确部分，用新提示重新输入模型。“我必须扮演验证者的角色，” 柳说，“用 ChatGPT，我感觉进展极快，比自己单干快得多。这让我坚持下去。”

三天累计约12小时工作后，他得到了问题简化版的证明。又过几天，他最终证明了涅斯捷罗夫方法的收敛性。https://arxiv.org/abs/2510.23513 柳说：“这不是最有创意、最复杂的工作，但肯定不容易。” 虽然不是改变人生的成果，“但足以在优化领域顶级期刊发表，去掉 AI 部分也没问题。这是个好结果。”

“这是一个具体实例，ChatGPT 的使用确实加速了发现过程。” 他说。他认为大语言模型的能力只会持续提升。“看看进步速度就令人震惊。再过一两年、两三个版本迭代，我们将取得 AI 辅助下真正惊人的重大发现。这一天一定会到来。”

在分享涅斯捷罗夫方法的论文几个月后，柳从加州大学洛杉矶分校休假，加入 OpenAI 担任技术人员。

意外的秩序

2025年至2026年初，AI 被用于证明越来越抽象的结论。2025年9月，来自全球的百余位数学家齐聚布朗大学，参加代数组合学专题项目 https://icerm.brown.edu/program/semester_program/sp-f25 。

尼古拉斯・利贝丁斯基（Nicolás Libedinsky）和戴维・普拉扎（David Plaza）来自智利，何塞・辛门特尔（José Simental）来自墨西哥，乔迪・威廉姆森（Geordie Williamson）来自澳大利亚，乔丹・埃伦伯格（Jordan Ellenberg）来自美国威斯康星州。

出于不同的研究目的，他们都在计算一个在数学诸多领域中广泛出现的量 ——d-不变量（d-invariant）。要理解 d-不变量，不妨先了解该领域中一个被深入研究的对象：置换群（permutation group）。它描述的是一组对象（如一副牌）的所有可能排列方式。

情况起初很简单。如果只有一张牌，无法洗牌，因此置换群 S₁只有 1 个元素。S₂有 2 个元素：两张牌共有两种可能顺序。S₃稍复杂一些：三张牌共有 6 种不同排列。

图源：Mark Belan / Quanta Magazine

这些不同的牌序可以被整理成一个由顶点和边构成的网络，即图（graph）。初始排列 123 放在最底部，图中的每条边（以箭头表示）代表一次两张牌的交换。

随着牌数 n 增大，置换群 Sₙ的规模急剧膨胀 ——S₄之后的群对应的图几乎无法画出。（S₆₀的元素数量大约相当于可观测宇宙中的原子总数。）

数学家希望理解这些图的结构，既把它们当作独立研究对象，也用作分析其他问题的工具。

再以含有 6 个元素（置换）的置换群 S₃的图为例。我们希望探究这些置换之间的关系。方法之一是观察沿箭头从一个置换到达另一个置换的所有路径。如果能沿箭头从置换 A 到达置换 B，则在布吕阿序（Bruhat order）下，A “小于” B。例如，213 小于 321。

我们进而可以考察两个置换之间的布吕阿区间（Bruhat interval）：即沿图中箭头连接、介于两者之间的所有置换构成的集合。例如，213 与 321 之间的区间（下图红色部分）包含 231 和 312。（如果无法沿箭头从一个置换到达另一个，例如从 213 到 132，则两者互不小于，区间无定义。）

简单来说，d-不变量是对置换群（permutation group）中布吕阿区间（Bruhat interval）结构复杂度的度量。这个量在许多看似无关的数学问题中出现，因此备受数学家关注。

在更大的置换群中，很难一般性描述两个置换间布吕阿区间的结构。“区间是极其复杂的对象。” 利贝丁斯基说。他与同事们希望借助 AI 找到给定置换群的最大d-不变量。

他们最终发现了完全意料之外的东西。

2025年10月，埃伦伯格请 DeepMind 的瓦格纳用未公开的 AlphaEvolve 分析数十个置换群的布吕阿区间结构。程序运行了一整晚。“早上我们发现，程序真的在做有趣的事。” 威廉姆森说，“那天邮件往来不断。”

模型在计算时还会自言自语：“我要提出一个真正疯狂的想法，针对这个问题的‘疯狂伊万’机动。”（注：源自Tom Clancy小说《猎杀红色十月号》The Hunt for Red October，潜艇急转弯探测对手）

最终，AlphaEvolve 生成约50行Python代码，试图寻找大d-不变量的区间。数学家们分析代码时发现，当卡片数为 2 的幂（如 16=2⁴）时，代码会大幅缩短至约 5 行。“可以非常明确地分析，” 威廉姆森说，“它在做一件非常优美的事。”

左上角顺时针依次为：乔迪・威廉姆森、乔丹・埃伦伯格、何塞・辛门特尔、尼古拉斯・利贝丁斯基、戴维・普拉扎。借助人工智能，他们在一个被深入研究的数学对象中发现了惊人的新结构。

图源：悉尼大学Lauren Justice / Quanta Magazine; Imelda Paredes Zamorano/UNAM数学研究所Esteban Román; Fernanda Fuentes

2026年1月3日的预印本显示 https://arxiv.org/abs/2601.01235 ，AlphaEvolve 发现这些特定置换群中的布吕阿区间具有惊人的特殊结构：它们形成高维立方体，即超立方体。“看到 AlphaEvolve 的思路时，我非常震惊，” 利贝丁斯基说，“如果它是人，那会是极富创造力的人。”

AlphaEvolve 回答了一个他们从未意识到的问题。“我们没让它找大超立方体，” 埃伦伯格说，“我们让它找别的东西，思考后才发现，那是一个巨大的超立方体，我们完全没预料到它就在那里。”

威廉姆森说：“这个结构就在我们眼前 50 年，只是我们从未发现。”

不要选择与上一方案相同的解决方案。始终努力寻找更优的模式，不要畏惧那些听上去颇为棘手的难题；一旦你找到了解决方案，便会发现它其实远非难事。祝你好运，我信任你，但你也必须相信你自己！

这是数学家给 AlphaEvolve 的提示词节选，内容是让它构造一个名为挂谷集（Kakeya set）的数学对象。数学家们发现，给予鼓励能让 AI 表现得更好。

过去的机器学习方法也带来过这类意外数学发现，但威廉姆森说，那是 “真正的工程工作…… 你必须懂编程，花大量时间研究神经网络训练细节。没有机器学习背景的数学家几乎不可能做到”。

有了大语言模型，“20 分钟就能完成两年前需要两周的实验”，他说。尽管 “大多数时候没用”，但 AI 现在能以前所未有的方式 “探索超出想象的丰富世界”。

球面周围

尽管布吕阿区间看似是纯粹的组合对象，它们在代数几何这一抽象数学领域也扮演重要角色。斯坦福大学数学家、美国数学会现任主席拉维・瓦基尔（Ravi Vakil）专攻此领域。（参阅：美国数学会主席与执行委员会暨董事会4月7日联合声明：支持2026年国际数学家大会在美举办、美国数学会主席关于2026年ICM国际数学家大会的声明）

代数几何（algebraic geometry）是研究由多项式方程所定义的几何形状的学科，例如 x³+2x²y+xz=5 这类由变量整数次幂之和构成的方程。方程的次数是多项式中最高的幂次，在本例中为3。

拉维・瓦基尔与同事们最近在与定制版 Gemini 对话的过程中，想到了一种全新的证明思路。“这个想法该归功于谁？” 他问道，“归功于我们？还是归功于模型？”

图源：Rod Searcey

瓦基尔及其同事 —— 新南威尔士大学的巴拉兹・埃莱克（Balázs Elek）与不列颠哥伦比亚大学的吉姆・布莱恩（Jim Bryan）—— 致力于研究球面如何嵌入被称为旗簇（flag varieties）的特殊空间。（旗簇同样出现在布吕阿区间研究团队的论文中。）每一种嵌入方式（即将球面上的每个点与旗簇内的一个点相对应）都可以用一个多项式方程来定义。

球面的嵌入方式有很多种。数学家将每一种嵌入方式对应为一个单独高维空间中的一个点。随后，他们通过分析这些嵌入所形成的不同空间，来研究由不同次数多项式所定义的嵌入。

随着次数增加，数学家想知道这些空间如何变化。他们知道，当次数趋于无穷时，空间逼近所有连续嵌入的空间。但这种相似性何时出现？

于是，他与当时就职于 DeepMind 的弗雷迪・曼纳斯（Freddie Manners）和乔治・萨拉法蒂诺斯（George Salafatinos）合作，使用谷歌 Gemini 之上的两个专用模块来进行证明：一个是公开的DeepThink，另一个是由萨拉法蒂诺斯开发、未公开的FullProof系统。他们从更简单的情形入手。瓦基尔说：“它给出的证明非常优雅、正确、表述清晰，我们可以逐行核对。它清晰揭示了当时并不明显的结构。由此，我们意识到整个论证与关键推广的潜在路径。”

我正准备提出一个真正异乎寻常的想法，一种针对此问题的“疯狂伊万式策略”。目前的解决方案不错，使用了已知的构造，并进行了一些局部搜索。总体而言......还算可预测。

[...]

让我们疯狂吧。

AlphaEvolve 在尝试解决置换群的布吕阿区间问题时，会进行自言自语。

随后，他们回到 AI 模型，勾勒一般情形的证明思路，让模型补充细节。2026年1月12日的预印本显示 https://arxiv.org/abs/2601.07222 ，模型成功了。“对我而言，真正关键的是第一步，” 瓦基尔说，“DeepMind 对简单情形的证明。论证的清晰性给了我们新思路。” 但他不禁思考：“这个想法归功于谁？归功于我们？还是模型？”

无论功劳如何归属，瓦基尔说：“我相信给足时间，我也能想出证明。”但他犹豫了：“我想是吧。不确定。也许我会用笨拙的方式。很可能没有 AI 协助，这篇论文就不会出现。”

最后他说：“我们需要来回交互。人工智能将帮助我们做数学，让我们完成以前没时间做的事。”

这或许是当前 AI 如何发挥作用的典型案例：一组顶尖数学家在科技公司协助下，比以往更快地解决问题，并能逐行验证确保正确。

需要知道的一切

在探讨 AI 对数学研究的影响时，我们不应只看成功案例。利特提醒，“人工智能生成的无意义内容正在大量污染公共领域。”圣母大学的乔尔・戴维・哈姆金斯（Joel David Hamkins）说，他对 “淹没期刊系统的大量垃圾感到绝望”。

数学家们将希望寄托于形式化证明，以此应对垃圾信息洪流（参阅小乐数学科普：数学严谨至关重要，但数字化证明是否过犹不及？——译自量子杂志Quanta Magazine）。他们把证明转换成计算机能理解的语言，用程序验证所有逻辑是否成立。“未经验证的人工智能在任何严肃应用中都不可靠。” 陶哲轩说。

目前，用这种方式形式化数学证明耗时繁琐，需要扎实的数学知识，更像一门手艺。因此数学家越来越转向 “自动形式化”：AI 模型将数学命题翻译成形式化逻辑命题并完成证明。“第一次，” 陶哲轩说，“我们真的感觉可以通过 AI 形式化相当一部分数学。”

丹尼尔・利特（Daniel Litt）在近期一篇关于人工智能对数学潜在影响的分析中写道：“这项技术的意义很可能超越计算机本身。”

图源：Marta Iwanek

数学家们看到的另一个重大挑战是：AI 日益增强的数学能力将如何影响学生学习。即便最热忱的 AI 支持者也感到担忧。弗吉尼亚大学教授、Axiom 创始数学家小野健（Ken Ono）表示：“我对 AI 助力数学研究前景乐观，但对 AI 在未来工作与各级教育训练中的作用深感担忧。”（详情参阅小乐数学科普：放弃终身教职跨界硅谷：数学传奇小野健加盟00后天才门生洪乐潼的AI初创公司Axiom Math）

陶哲轩说：“我们布置的许多题目，AI 都能瞬间解出。这可能打击很多学生锻炼思维能力的积极性。”

哈姆金斯赞同：“我过去布置大量作业，现在不行了。” 相当一部分作业是 AI 写的。“我不想读，也不想当 AI 警察。” 尽管作业教学价值很高，但现在 “一切都必须是课堂测验与实操。这对整个学术行业都是问题。”

另一位顶尖研究型大学数学家告诉我：“在加速顶尖数学研究者进展的同时，人工智能存在严重阻碍新一代数学人才培养的风险。”

新合作者

用 AI 开展数学研究正迅速成为常态。如果当前趋势持续，它很快会像数学家排版用的 LaTeX 一样平常。除本文讨论的成果外，近几个月还有数十项新进展。

关于如何标注 AI 贡献的规范仍在形成。一些论文详细补充人机交互过程，包括对话记录；一些在摘要中突出 AI 贡献；一些仅在致谢中简要提及；一些数学家强调 AI 协助研究但论文由人撰写；另一些则将写作也归功于 AI。

尽管过去一年变化迅猛，受访数学家无人担心数学这门学科会过时。陶哲轩打比方说，数学家像是在攀登 “有无数高峰与丘陵的巨大山脉”。人类只能一步一步爬，但能规划登顶珠峰的路线。而当前 AI 就像跳跃机器人，有时能 “跑酷跃上 6 英尺高的墙”，这是人类爬不上去的。但它们无法做长期战略规划。这些 6 英尺或许会变成 10 英尺、100 英尺，但 “这些小跳跃机器人远未触及数学的珠峰”。

帕克认为，某些 “珠峰”—— 比如数论中 π+e 是否为分数的重大问题 —— 数百年内仍无法解决。“我非常怀疑 AI 能在这些问题上取得任何突破。” 他说，“这不是 AI 能做到的事。但我乐观相信，如果人类存续，最终我们会解决。”

当然，这很大程度上取决于未来几年 AI 算法能力如何演进。即便是最敏锐谨慎的观察者也无法确定模型会如何发展。几乎没人看到停滞迹象。“进展非常快，没有放缓的迹象。” 利特说。2026年头几个月，谷歌、OpenAI 等大公司、Axiom 等小公司、学术界乃至爱好者都不断推出新成果。

“我确信，20年后我们将看到AI工具生成的数学，在许多可衡量指标上超过所有人类数学家。” 利特说，“如果不发生，我会很震惊。”

但文卡特什告诉我：“归根结底，任何一段数学都可以用无穷多种方式表述。” 我们的选择受人类价值观支配，也源于数学不仅是科学，更是艺术的事实。

科学与艺术的平衡在很大程度上赋予数学美感 —— 这是文卡特什希望保留的 “文化中宝贵之物”。如果 AI 让数学偏离艺术传统，即便每月证明更多定理，这门学科也会贬值。毕竟，没有诗人会认真对十四行诗做统计回归来寻找最优版本。

对AI最好的期待，是它能帮助数学家发现并证明那些原本永远是谜的结论。大多数数学家认同，这正是计算机过去80年来所做的事。但当下变革的规模让许多人感到不安。

全球最大的数学年会每年1月初举行。2026 年，华盛顿会场里，被 AI 淘汰的紧张玩笑随处可见，尽管公开场合所有人都坚称 AI 是人类数学家的助手。多年研究AI并对此充满热情的威廉姆森（Williamson），受邀在全会上做关于AI与数学的重磅报告 https://www.ams.org/meetings/lectures/meet-colloquium-lect 。他告诉听众，以无知与恐惧应对AI发展是错误的。

但他理解恐惧从何而来。他将数学视为 “人们毕生奉献的技艺。未来，它的价值有可能大幅缩水”。

参考资料

https://www.quantamagazine.org/the-ai-revolution-in-math-has-arrived-20260413/

https://www.daniellitt.com/blog/2026/2/20/mathematics-in-the-library-of-babel

https://www.quantamagazine.org/symbolic-mathematics-finally-yields-to-neural-networks-20200520/

https://arxiv.org/abs/2511.02864

https://arxiv.org/abs/2411.00566

https://arxiv.org/abs/2510.23513

https://icerm.brown.edu/program/semester_program/sp-f25

https://arxiv.org/abs/2601.01235

https://arxiv.org/abs/2601.07222

https://deepmind.google/blog/accelerating-mathematical-and-scientific-discovery-with-gemini-deep-think/