下载客户端

KAN2.0震撼发布：构建AI+Science大统一的新范式

2024-08-23 11:36

来源：澎湃新闻·澎湃号·湃客

听全文

原创李颂元集智俱乐部

摘要

还记得被火爆的 KAN 支配的五一假期吗？。就在北京时间8月20日，Max Tegmark 团队发布了 KAN 的拓展工作 KAN 2.0（开源代码库也从 pykan 0.1 更新到了 pykan 0.2）。KAN 2.0 呈现的不仅是一个优化升级的网络架构，更是一种 AI+Science 的研究范式，这一范式使得 AI+Science 的研究更具有交互性和可解释性。

研究领域：AI+Science，KAN，AI可解释性，符号主义，连接主义

李颂元 | 编译

刘子鸣 | 审校

论文题目：

KAN 2.0: Kolmogorov-Arnold Networks Meet Science

论文地址：

https://arxiv.org/abs/2408.10205

近年来，人工智能在蛋白质折叠预测、自动化定理证明等任务取得了显著的进步。这些任务的共同点在于它们都有清晰的目标，可以由 AI 优化，而 AI 在其中是一个黑箱。尽管这种研究范式在上述这些应用驱动的任务中表现得非常好，但是别忘了我们还有好奇心驱动的科学。对于好奇心驱动的科学，研究过程更多是探索性的。除了获取对这个世界更多的知识，我们往往没有什么清晰的目标。有人可能会说，这种好奇心驱动的科学没什么用，恰恰相反——好奇心驱动的科学所发现的知识，往往是未来技术的基石，并且能催生出大量的应用。

好奇心驱动的科学和应用驱动的科学，它们问出的问题是不一样的。以 AlphaFold 为例，它之所以还停留在应用科学领域，是因为尽管它能成功地预测蛋白质的结构，却没有在更本质的层面发现什么新知识。AlphaFold 既然有如此高的预测准确率，它本应该发现了我们还不知道的知识，但是由于它是一个黑箱，它所发现的知识我们一无所知。因此，KAN 2.0 的作者们呼吁学界需要一种新的人工智能+科学的研究范式以支持好奇心驱动的科学的发展。这种研究范式对 AI 工具所提供的交互性和可解释性有很高的需求，这样这些 AI 工具才能无缝整合到科学研究中。

初代的 KAN 就提供了这么一套交互式的、可解释的 AI 工具，因为初代 KAN 把高维的函数分解成了若干个一维的函数，对这些一维函数的符号回归就形成了对原函数的一种解释。然而，初代 KAN 对可解释的定义还是有点狭隘，把可解释性等价于能否用数学符号表示。实际上科学不是总能够或者需要用符号来表示。比如化学和生物的问题，有时用公式表达反而过于复杂。在这些领域中，发现关键的特征和模块化的结构可能就够了。

另一个容易被忽视的问题是，我们可以在 KAN 中注入先验知识吗？对于科学而言，领域知识是非常重要的。即便只有很少的数据，甚至没有数据，我们也能从事科学研究。KAN 2.0 的作者们提出把先验知识用 KAN 表达出来，并且可以结合数据，在 KAN 中发现新的知识。

KAN 2.0 的研究思路如下图所示。作者在第二节提出了一个改进的 KAN，即MultKAN，这是一种加入了乘法操作的 KAN。因为在科学中乘法无处不在，加入乘法可以在许多情况让训练出来的KAN网络结构更简洁。初代的 KAN 可以看成是 MultKAN 的一个特例。KAN 2.0 正文中所说的 KAN 都是 MultKAN。在此基础之上，作者在第三节为 KAN 注入三种科学知识：辅助变量（特征）、模块化结构和符号公式，这个路径是从科学到AI (Science for AI)。同时，作者在第四节中，又从 KAN 中发现重要特征、模块化结构和符号公式，这个路径是从 AI 到科学 (AI for Science)。完整的故事就是 AI + Science。

当前 AI + Science 的主要挑战是，AI 和 Science 在主流的研究范式上存在冲突——主流的 AI 的连接主义的，而科学是符号主义的。KAN 2.0 所提出的 AI + Science 的研究范式，就是架起连接主义和符号主义的桥梁。论文的第五章探讨了 KAN 在守恒量、函数对称性、拉格朗日函数和本构定律方面的应用。

原标题：《KAN 2.0 震撼发布：构建AI+Science大统一的新范式》

阅读原文

特别声明

本文为澎湃号作者或机构在澎湃新闻上传并发布，仅代表该作者或机构观点，不代表澎湃新闻的观点或立场，澎湃新闻仅提供信息发布平台。申请澎湃号请用电脑访问http://renzheng.thepaper.cn。

我要举报