• +1

75年AI从图灵测试到万亿参数,3大阶段+11个核心术语,一篇文章带你了解人工智能前世今生

2026-03-20 06:57
来源:澎湃新闻·澎湃号·湃客
听全文
字号

2025年是人工智能爆发的一年,《人工智能+行动意见》的发布,多家顶级大厂大模型相继开源,AI已经悄悄的流窜在我们生活的各个角落,查信息用AI、剪视频用AI、办公用AI等等。

当GPT-5能写出科研论文,智能体能协助人类进行办公时,人工智能早就已经不是人们早期假想的科幻概念。

但鲜有人知的是,从机器能否思考的哲学追问,到今天千亿参数的模型,人类其实走了整整75年。

通过这篇文章我将带你穿越AI发展史,同时科普部分人工智能行业的浅显知识,带你快速了解现如今最前沿的科技领域。

AI的前世今生,从1950年到2025年

——人工智能萌芽期(1950年-1970年)

1950年,英国科学家艾伦·图灵,在《计算机器与智能》论文中提出图灵测试概念​,首次定义了机器智能,他也被人们称为人工智能之父。

1956年,美国汉诺威镇举行的达特茅斯会议,麦卡锡第一次提出了人工智能(AI)概念,同时,也推动了人工智能成为了独立学科。

1970年,斯坦福大学教授特里威诺格拉德,研发SHRDLU系统,能在特定环境中执行命令,进行交互,预示着人工智能在自然语言处理领域中的重要突破。

然而,早期的人工智能发展受限于计算能力,计算机系统还只能处理特定任务,所以无法进行大规模推广和应用,人工智能也陷入了一段平稳期,其实也可以说是一段寒冬期。

——机器学习崛起(1997年-2017年)

1997年,IBM公司的象棋计算机“深蓝”,在比赛中打败了国际象棋冠军,证明机器智能拥有着强大的潜力。

2006年,英国科学家辛顿,首次提出了深度学习概念,通俗来讲就是让计算机通过多层次神经网络结构,能够模仿人类大脑进行学习。

2012年,AlexNet在ImageNet图像识别大赛中,将错误率从25.8%降低至15%,深度学习在图像识别领域实现了重大突破。

2017年,Google团队通过论文提出了Transformer架构,为后续的大模型研发奠定了基础。

——大模型爆发(2018年-至今)

2018年,OpenAI发布GPT-1,成为基于Transformer架构用于语言生成的模型。2年后,也就是2020年,GPT-3上线,展现了少样本学习的能力,代表着AI在语言生成、多任务处理等方面重大突破。

2022年,ChatGPT上线,通过RLHF技术,让模型能理解人类的想法,上线后,全球用户量瞬间激增,也是人工智能第一次广泛的被大众熟悉和使用。

2024年,我国深度求索公司,上线6710亿参数的DeepSeek-V3,训练成本极低,而且性能不输同期主流模型,成为国内大模型发展的标志性突破。

2025,全球大模型迎来了开源潮,国外Meta、谷歌等科技公司相继开源LLaMA-3、Gemini-Pro等主流模型,国内科技大厂如字节跳动、华为等也逐步推出全参数开源模型,大模型的技术迭代、产业落地全面加速。

了解完AI的前世今生后,相信你应该对人工智能已经有了一个基础的概念,接下来我将带你普及一些大模型的基础知识,加深你对大模型的概念。

1.大模型:通过海量数据进行训练,能够理解人类语言,生成内容,跨领域解决问题。

3.大模型参数:一般以亿(B)为单位,类似于人类大脑的脑细胞,参数越多,学习能力越强,知识越丰富。

4.Token:模型处理文本的最小单位, 1000Token约等于750个单词或500个汉字,Token数量决定模型记住上下文的长度,记住的越多,越擅长长本文分析。

5.Transformer架构:能够让大模型在处理文本时像人类一样划重点,比如让它分析:小猫追老鼠,它累了,模型能通过自注意力定位“它”指的是小猫。

6.多模态:早期的人机交互方式很单一,比如只能通过文字交互,输入一段文字,机器回复一段文字,多模态能够同时处理文本、图片、音频、视频等,交付方式比较丰富。

7.预训练:通过文本、书籍等多种方式让模型全量吸收数据,掌握基础的知识,但不精通专业技能。

8.微调:通过更新部分参数或用标注数据训练模型,让模型在某个行业或者领域更加专业,如农业领域,医疗领域等。

9.对齐优化:通过RLHF(人类反馈强化学习),先让人类给模型回答打分,再用分数训练模型,减少大模型胡说八道(幻觉),让模型输出符合人类价值观的内容。

10.RAG(检索增强生成):让AI先检索知识,再进行回答,比如向AI提问,JDD大会有哪些产品发布?这时AI会先搜索资料,结合检索结果进行回答。

11.智能体(Agent):能够自主理解任务、规划步骤、调用工具的AI 机器人。比如你让它定一杯咖啡,它能够自动选店、确认偏好,同时调用支付系统进行支付。

12.提示词(Prompt): 通过精准提问,让模型输出优质的结果,如让AI写一个文案,不仅仅说写个文案,而是说写母婴产品朋友圈文案,突出安全材质,语气亲切。也就是让AI更懂你的场景和要求。

讲了这么多,相信你对人工智能大模型已经有了一个基本的认知,如果还有哪些好的想法和疑问,也可以留言互相探讨!

    本文为澎湃号作者或机构在澎湃新闻上传并发布,仅代表该作者或机构观点,不代表澎湃新闻的观点或立场,澎湃新闻仅提供信息发布平台。申请澎湃号请用电脑访问http://renzheng.thepaper.cn。

    +1
    收藏
    我要举报
            查看更多

            扫码下载澎湃新闻客户端

            沪ICP备14003370号

            沪公网安备31010602000299号

            互联网新闻信息服务许可证:31120170006

            增值电信业务经营许可证:沪B2-2017116

            © 2014-2026 上海东方报业有限公司