澎湃Logo
下载客户端

登录

  • +1

即将过去的2022年,人工智能发展成啥样了?|有数

2022-12-29 17:51
来源:澎湃新闻·澎湃号·湃客
字号

2022年,人工智能技术突飞猛进,更深入地介入人类生活。人类创造了AI,却并不那么了解它,欣喜又畏惧。AI是谁?经历了怎样的发展?对人类影响几何?澎湃 · 美数课与湃客 · 有数联合推出《AI来的那一夜》,去记录AI当下的发展、探寻人们对AI好奇的问题。

本文为系列第二篇。

【专题】AI来的那一夜

AI极简史:文字如何生出万物?

本文为“有数”栏目独家稿件,由照路明 x 有数联合出品,转载请注明作者名、“照路明”以及“发自澎湃新闻湃客频道”。

2022 年终于要结束了。这一年发生了许多事。人工智能(AI)技术的突飞猛进是其中一件。

或者说,这一年,人工智能的发展更被人们所熟知了。你应该已经听闻,人工智能正在帮我们做很多事。例如,陪我们聊天,帮我们画画,写一些陈词滥调的稿件,或者悄悄融入数字生活,让各项算法成为社会运转的基础设施。这篇文章想带你了解,人工智能的科学研究走到了哪一步,我们将如何审视它。

 

| 今年,哪些人工智能进展让人印象深刻?

 

2022 年出现了不少令人兴奋的人工智能研究成果。2 月,谷歌(Google)旗下的 DeepMind 公司推出了 AlphaCode,这是一款大规模生成编程代码的系统。在编程竞赛平台 Codeforces 上,研究人员让 AlphaCode 完成了 10 项代码编程挑战。结果显示,它的总体排名位于前 54%。也就是说,它的编程工作击败了 46%的人类“码农”。

用 AI 替代开发 AI 的劳动,这是研究者一直想做的事,尽管效果总是有待商榷。5 月,DeepMind 公司又推出了“通用人工智能模型”Gato,声称它可以完成人机聊天、玩游戏、机器人操纵、分析蛋白质序列等多场景的任务,而不限于单一工作。

通用人工智能模型是人工智能开发的重点方向,是指能够在不同任务或领域中通用的人工智能模型。这种模型可以被训练来执行多种任务,而不是专门为某一种任务而设计。

换句话说,人们希望它具有解决现实世界复杂问题的综合能力。完成这一挑战自然不容易,Gato 的出现也未能平息质疑的声音。不过,在某一特定技能的表现上,今年的一些人工智能模型已经取得了令人惊讶的成效。

 

例如,今年大火的 AI 绘画领域,由 Stable Diffusion 和同期出现的 DALL-E2、Midjourney 等深度学习模型带火。

你或许已经体验过输入几句文字描述就可以生成一幅对应图像的神奇效果。重点在于,生成的图像看起来还不错。例如,下方这些如同摄影作品的人物肖像画,就是由 Stable Diffusion 生成的。这些生成式 AI 将人们对于人工智能只能完成一些重复性劳动的印象,转向了艺术创作领域。

 

从“文字生成图片”到“文字生成视频”(Text-to-Video,T2V),Meta 公司(原 Facebook)9 月推出的人工智能工具 Make-A-Video 也引发过热议。同样是输入描述文本,Make-A-Video 直接生成了一个短视频,这意味着拍摄、建模、剪辑等工作流程可以全部跳过。例如,“手握遥控器的猫”,这是他们提供的生成结果:

 

你会发现两个特点:首先,视频的清晰度不算高。其次,持续长度较短。将连续生成的原创图像串联为动态画面,这是今年的人工智能工具尝试在视觉领域完成的事,但成长空间还很大。

与此同时,在传统的文本领域,突出的技术进展已经出现。

此前,聊天机器人给你的体验总是驴唇不对马嘴,或者只能理解一些简单的文本描述。而今年 11 月底,OpenAI 公司提供的 ChatGPT,能力就要高上许多。它“学识渊博”,面对人类提出的各种刁难问题,可以从容不迫地给出回答。

人们还惊讶地发现,吸收了大量人类社会知识的 ChatGPT,可以在修改代码、写文章等方面发挥作用——这些自动生成的文本,不乏陈词滥调的观点,但组织得颇有条理,难辨真假。比如,你很难察觉,前文关于“通用人工智能模型”定义的那段话,就是 ChatGPT 自己写的。

 

| 近五年,人工智能研究实现高速发展

 

人工智能,来势汹汹。无论哪种模型,一个共同的目标是让它们的工作结果接近人类,直到超越人类的准确性、创造性与效率。

人工智能的科研工作在半个世纪里存在,但在最近五年实现了高速发展。2017 年,人工智能研究在当年所有科研文献占据了 3.06%的比重。截至 2022 年 9 月,这一数据来到了当年的 5.69%,这成为 AI 应用成果涌现的根本动力。

 

中国保持着人工智能科研成果数量的优势。2021 年,中国以 31%的全球人工智能科研文献占比,领先于美国、欧盟与英国。

与此同时,从 2010 年到 2021 年,美国和中国在人工智能研究上的跨国合作数量最多,自 2010 年以来增加了 5 倍。2021 年的中美合作出版物数量,是中英合作产出的 2.7 倍。

 

除了人工智能学科本身的科研文献激增,AI for Science(面向所有科学的人工智能)的呼吁正在被各学科接纳。根据澳大利亚联邦科学与工业研究组织(CSIRO)的报告,如今的人工智能在 98%的研究领域得到采用。计算机科学以外,数学、决策学、工程、神经科学等领域基于人工智能的研究成果颇多。

所以你会注意到,“计算+学科”成为学科范式转型的普遍方向之一:利用DeepMind 团队提供的人工智能模型,纯数学理论学家正在证明或提出新的数学定理;2020 年,DeepMind 推出的 AlphaFold 2工具,实现了对人类大部分蛋白质结构的精准预测,其团队被推举为诺贝尔化学奖的有力竞争人选。

 

科研发现的速度加速,有机器学习(Machine Learning)方向的助推。过去十年,机器学习的科研文献数量激增,并成为一个中心技术概念,作用到计算机视觉、算法、数据挖掘等关系紧密的方向研究中。

机器学习的目标是让计算机从训练数据中学习特征,并在未知数据中执行分析与预测任务,比如识别图像中的物体或者预测未来股票价格。

深度学习(Deep Learning)是机器学习中的一种方法,它使用了大量的神经元(或称为节点)构成的多层网络来学习特征表示和预测结果。这种方法通常用于解决较为复杂的问题,比如自然语言处理、计算机视觉和语音识别等。

前文提到的人工智能进展,几乎都需要深度学习方法的引入。例如,对话能力惊人的 ChatGTP,是由 OpenAI 公司的 GPT-3 模型变体而成。而初代的 GPT-3 模型,有 3000 亿单词的语料训练和 1750 亿参数。Stable Diffusion 训练所使用的 LAION-5B 数据库,包括了 58.5 亿张图片素材。这些指数级增长的训练数据,让它们的能力有了质的飞跃。

 

相应地,训练的时间与财务成本在下降。根据斯坦福大学的《2022 年 AI 指数报告》(2022 AI Index Report),2018 年以来,图像分类系统的训练时间缩短了94.4%。2021 年,训练一个高性能的图像分类系统成本只需要 4.6 美元,同比 2017 年预计的 1112.6美元,下降至 1/223。

作为结果,人工智能的语言和图像识别能力迅速提高。近两年,人工智能在阅读、声音、图像等基准上的表现已接近或超过人类水平。所以你很容易体验到,在短视频拍摄中使用搞怪的脸部特效、将开会录音迅速转化为文字记录。而在 10 年前,还没有机器能够在人类水平基准上提供可靠的语言与图像识别。

 

| 与人工智能相处:成为敌人还是朋友?

 

科学幻想中的人工智能应用,应该有不少将步入现实。正如电影《她》(Her)当中,男主人公爱上了一位叫做“萨曼莎”的姑娘——一项人工智能系统中的虚拟人物。我们终究要与人工智能相处,而这些人工智能系统在各项社会线索上都愈发趋近于人类。人们可能会爱上它,讨厌它,抵制它,百感交集。

在今年 10 月,我采访了 1500 位中国大学生,来看看他们的看法。

具体来说,大学生们被鼓励用隐喻的形式提供对于人工智能的第一感受,然后用一段话来解释为什么会想到这种隐喻。隐喻的价值在于可以窥探人们与人工智能相处时的情感与权力关系:在人们眼中,人工智能是敌是友?是关系疏远还是亲密无间?

调研的结果是乐观的。绝大多数人表达了对人工智能的正面态度,最常被使用的隐喻是“助手”,即认可人工智能对生活的辅助作用。也有一些人认为它是地位平等的“朋友”,或者视它的地位高于人类,是“超人”“孙悟空”“哆啦 A 梦”,或者是维持生命必不可少的“水”和“空气”。

 

当然,有部分受访者表达了对人工智能持有矛盾或负面态度。例如,反对者认为人工智能不过是“傀儡”“木偶”与“定时炸弹”——利好之处是假象,大的危机酝酿其中。也有一部分人保持中立。接纳人工智能的同时,指出它当前的缺陷与不良的社会效应,比如不够聪明,以及内容造假、隐私侵犯、偏见等伦理问题,并相信需要改善使用它的方式,来促进社会福祉。

 

在很长一段时间内,对伦理的考量都将影响人工智能的发展。例如,在 ChatGPT 发布之前,谷歌研发的对话式人工智能系统 LaMDA 却一直未向公众发布。今年 3 月,谷歌研究人员 Lemoine 认为 LaMDA 已具有“自主情感”。他通过一段内部的对话实录表明 LaMDA 如何向人类表明它的主观感受。至少,它说服了 Lemoine。

 

谷歌研究人员Lemoine提供的报告《LaMDA具有情感吗?》(Is LaMDa sentient?)中的对话节选。编译:知乎用户@方觉闲

Lemoine 的主张遭到了谷歌当局与多数学者的批评,他们相信 LaMDA 依然建立在大规模参数的神经语言模型下,是人类训练指导出的对话结果,而非 LaMDA 具有自主意识的证据。

但这一案例向我们表明,无论人工智能是否真的有意识,它的对话能力已足够说服人类,从而可能回答计算机学家图灵提出的“机器能思考吗?”(Can machines think?)这一关键问题,并进一步带来担忧的声音。

轻舟已过万重山。如何让人工智能促进社会福祉,将是一个收益伴随风险的长久问题。投资者希望用人工智能讲出新故事,普通人的需求是这些人工智能是否有用于我们的生活,而不会反过来摧毁一切。回到最朴实无华的展望上,人们想知道,人工智能叙事下的世界,会变得更好吗?这是一切新年愿望的母题。

让我们看看 ChatGPT 的回答。

“嗨,ChatGPT,未来的世界会更好吗?”

ChatGPT 是这么说的:

“这个问题很难回答。我们都希望世界会变得更好,但是未来会如何发展是不确定的。目前,世界正面临着许多挑战,比如病毒和冲突。希望人类能够克服这些挑战,使世界变得更美好。”

 

参考资料:

[1]Li, Y., Choi, D., Chung, J., Kushman, N., Schrittwieser, J., Leblond, R., ... & Vinyals, O. (2022). Competition-level code generation with alphacode. Science, 378(6624), 1092-1097.

[2]Reed, S., Zolna, K., Parisotto, E., Colmenarejo, S. G., Novikov, A., Barth-Maron, G., ... & de Freitas, N. (2022). A generalist agent. arXiv preprint arXiv:2205.06175.

[3]Rombach, R., Blattmann, A., Lorenz, D., Esser, P., & Ommer, B. (2022). High-resolution image synthesis with latent diffusion models. In Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (pp. 10684-10695).

[4]Singer, U., Polyak, A., Hayes, T., Yin, X., An, J., Zhang, S., ... & Taigman, Y. (2022). Make-a-video: Text-to-video generation without text-video data. arXiv preprint arXiv:2209.14792.

[5]Zhang, Y., Sun, S., Galley, M., Chen, Y. C., Brockett, C., Gao, X., ... & Dolan, B. (2019). Dialogpt: Large-scale generative pre-training for conversational response generation. arXiv preprint arXiv:1911.00536.

[6]Clark, J., & Perrault, R. (2022). AI index report 2022. Technical report, Stanford University.https://aiindex.stanford.edu/wp-content/uploads/2022/06/2022-AI-Index-Report_Chinese-Edition.pdf

[7]Davies, A., Veličković, P., Buesing, L., Blackwell, S., Zheng, D., Tomašev, N., ... & Kohli, P. (2021). Advancing mathematics by guiding human intuition with AI. Nature, 600(7887), 70-74.

[8]Jumper, J., Evans, R., Pritzel, A., Green, T., Figurnov, M., Ronneberger, O., ... & Hassabis, D. (2021). Highly accurate protein structure prediction with AlphaFold. Nature, 596(7873), 583-589.

[9]Kiela, D., Bartolo, M., Nie, Y., Kaushik, D., Geiger, A., Wu, Z., ... & Williams, A. (2021). Dynabench: Rethinking benchmarking in NLP. arXiv preprint arXiv:2104.14337.

[10]Stone, P., Brooks, R., Brynjolfsson, E., Calo, R., Etzioni, O., Hager, G., ... & Teller, A. (2022). Artificial intelligence and life in 2030: the one hundred year study on artificial intelligence. arXiv preprint arXiv:2211.06318.

[11]CSIRO. (2022). Artificial Intelligence for Science report, Commonwealth Scientific and Industrial Research Organisation. https://www.csiro.au/en/research/technology-space/ai/artificial-intelligence-for-science-report

[12]Andrew Ng. (2022). Top AI Stories of 2022, DeepLearning.AI. https://www.deeplearning.ai/the-batch/issue-176/

[13]Floridi, L., & Chiriatti, M. (2020). GPT-3: Its nature, scope, limits, and consequences. Minds and Machines, 30(4), 681-694.

[14]Lemoine, B. (2022). Is LaMDA Sentient?—an Interview. Medium. Fecha de publicación, 11-06.

    本文为澎湃号作者或机构在澎湃新闻上传并发布,仅代表该作者或机构观点,不代表澎湃新闻的观点或立场,澎湃新闻仅提供信息发布平台。申请澎湃号请用电脑访问http://renzheng.thepaper.cn。

    +1
    收藏
    我要举报

            扫码下载澎湃新闻客户端

            沪ICP备14003370号

            沪公网安备31010602000299号

            互联网新闻信息服务许可证:31120170006

            增值电信业务经营许可证:沪B2-2017116

            © 2014-2024 上海东方报业有限公司

            反馈