下载客户端

75年AI从图灵测试到万亿参数，3大阶段+11个核心术语，一篇文章带你了解人工智能前世今生

2026-03-20 06:57

来源：澎湃新闻·澎湃号·湃客

听全文

2025年是人工智能爆发的一年，《人工智能+行动意见》的发布，多家顶级大厂大模型相继开源，AI已经悄悄的流窜在我们生活的各个角落，查信息用AI、剪视频用AI、办公用AI等等。

当GPT-5能写出科研论文，智能体能协助人类进行办公时，人工智能早就已经不是人们早期假想的科幻概念。

但鲜有人知的是，从机器能否思考的哲学追问，到今天千亿参数的模型，人类其实走了整整75年。

通过这篇文章我将带你穿越AI发展史，同时科普部分人工智能行业的浅显知识，带你快速了解现如今最前沿的科技领域。

AI的前世今生，从1950年到2025年

——人工智能萌芽期（1950年-1970年）

1950年，英国科学家艾伦·图灵，在《计算机器与智能》论文中提出图灵测试概念，首次定义了机器智能，他也被人们称为人工智能之父。

1956年，美国汉诺威镇举行的达特茅斯会议，麦卡锡第一次提出了人工智能（AI）概念，同时，也推动了人工智能成为了独立学科。

1970年，斯坦福大学教授特里威诺格拉德，研发SHRDLU系统，能在特定环境中执行命令，进行交互，预示着人工智能在自然语言处理领域中的重要突破。

然而，早期的人工智能发展受限于计算能力，计算机系统还只能处理特定任务，所以无法进行大规模推广和应用，人工智能也陷入了一段平稳期，其实也可以说是一段寒冬期。

——机器学习崛起（1997年-2017年）

1997年，IBM公司的象棋计算机“深蓝”，在比赛中打败了国际象棋冠军，证明机器智能拥有着强大的潜力。

2006年，英国科学家辛顿，首次提出了深度学习概念，通俗来讲就是让计算机通过多层次神经网络结构，能够模仿人类大脑进行学习。

2012年，AlexNet在ImageNet图像识别大赛中，将错误率从25.8%降低至15%，深度学习在图像识别领域实现了重大突破。

2017年，Google团队通过论文提出了Transformer架构，为后续的大模型研发奠定了基础。

——大模型爆发（2018年-至今）

2018年，OpenAI发布GPT-1，成为基于Transformer架构用于语言生成的模型。2年后，也就是2020年，GPT-3上线，展现了少样本学习的能力，代表着AI在语言生成、多任务处理等方面重大突破。

2022年，ChatGPT上线，通过RLHF技术，让模型能理解人类的想法，上线后，全球用户量瞬间激增，也是人工智能第一次广泛的被大众熟悉和使用。

2024年，我国深度求索公司，上线6710亿参数的DeepSeek-V3，训练成本极低，而且性能不输同期主流模型，成为国内大模型发展的标志性突破。

2025，全球大模型迎来了开源潮，国外Meta、谷歌等科技公司相继开源LLaMA-3、Gemini-Pro等主流模型，国内科技大厂如字节跳动、华为等也逐步推出全参数开源模型，大模型的技术迭代、产业落地全面加速。

了解完AI的前世今生后，相信你应该对人工智能已经有了一个基础的概念，接下来我将带你普及一些大模型的基础知识，加深你对大模型的概念。

1.大模型：通过海量数据进行训练，能够理解人类语言，生成内容，跨领域解决问题。

3.大模型参数：一般以亿（B）为单位，类似于人类大脑的脑细胞，参数越多，学习能力越强，知识越丰富。

4.Token:模型处理文本的最小单位， 1000Token约等于750个单词或500个汉字，Token数量决定模型记住上下文的长度，记住的越多，越擅长长本文分析。

5.Transformer架构：能够让大模型在处理文本时像人类一样划重点，比如让它分析：小猫追老鼠，它累了，模型能通过自注意力定位“它”指的是小猫。

6.多模态：早期的人机交互方式很单一，比如只能通过文字交互，输入一段文字，机器回复一段文字，多模态能够同时处理文本、图片、音频、视频等，交付方式比较丰富。

7.预训练：通过文本、书籍等多种方式让模型全量吸收数据，掌握基础的知识，但不精通专业技能。

8.微调：通过更新部分参数或用标注数据训练模型，让模型在某个行业或者领域更加专业，如农业领域，医疗领域等。

9.对齐优化：通过RLHF（人类反馈强化学习），先让人类给模型回答打分，再用分数训练模型，减少大模型胡说八道（幻觉），让模型输出符合人类价值观的内容。

10.RAG（检索增强生成）：让AI先检索知识，再进行回答，比如向AI提问，JDD大会有哪些产品发布？这时AI会先搜索资料，结合检索结果进行回答。

11.智能体（Agent）：能够自主理解任务、规划步骤、调用工具的AI 机器人。比如你让它定一杯咖啡，它能够自动选店、确认偏好，同时调用支付系统进行支付。

12.提示词（Prompt）: 通过精准提问,让模型输出优质的结果，如让AI写一个文案，不仅仅说写个文案，而是说写母婴产品朋友圈文案，突出安全材质，语气亲切。也就是让AI更懂你的场景和要求。

讲了这么多，相信你对人工智能大模型已经有了一个基本的认知，如果还有哪些好的想法和疑问，也可以留言互相探讨！

特别声明

本文为澎湃号作者或机构在澎湃新闻上传并发布，仅代表该作者或机构观点，不代表澎湃新闻的观点或立场，澎湃新闻仅提供信息发布平台。申请澎湃号请用电脑访问http://renzheng.thepaper.cn。

我要举报

#AI #Agent #大模型 #人工智能 #科技

扫码下载澎湃新闻客户端

澎湃矩阵

新闻报料

报料热线: 021-962866
报料邮箱: news@thepaper.cn

沪ICP备14003370号

沪公网安备31010602000299号

互联网新闻信息服务许可证：31120170006

增值电信业务经营许可证：沪B2-2017116

反馈