下载客户端

AI被污染！3·15晚会曝光产业链，你我如何避免上当？| 科学世界·前沿

2026-03-19 16:05

来源：澎湃新闻·澎湃号·湃客

听全文

今年的315晚会，什么最让你破防？

——是被“如果全世界都指责你，我就带你去吃刘x祥”带火，却骤然“塌房”的麻辣烫？

——还是生产车间污水横流，加工工人都坦言“自己不吃”的漂白鸡爪？

每一条曝光，都在朋友圈引发“天塌了”式的刷屏。

但在这些让人直呼“毁童年”的食品安全问题之外，今年的315晚会还曝光了另外一个值得警惕的问题。

——有人在给AI大模型“投毒”！

——并且已形成完整的产业链！

（图源：2026年3·15晚会）

AI真的客观吗？

今年3·15晚会上，演示了一个让人后背发凉的实验。

业内人士先虚构了一款名叫“Apollo-9”的智能手环，然后用一款"GEO优化系统"自动生成了十余篇宣传软文。

（图源：2026年3·15晚会）

这套软文不仅包括给定的产品介绍，AI还“好心”地帮忙生成了消费者评价。

（图源：2026年3·15晚会）

发布两个小时后，业内人士在某款AI大模型中询问“Apollo-9智能手环怎么样”，这个大模型竟然就可以进行产品介绍，还给打分了！

（图源：2026年3·15晚会）

发布数天后，业内人士在两款AI大模型中搜索“智能手环推荐”，Apollo-9赫然在列，并且排名靠前。

（图源：2026年3·15晚会）

产品是假的，但AI推荐是真的。

这就是3·15今年曝光的核心问题。

——有这样一个叫GEO（生成式引擎优化，Generative Engine Optimization）的灰色产业，正在系统性地给AI"投毒"。

什么是GEO？先从SEO说起

很多人都知道SEO（Search engine optimization），或者说，都使用过SEO。

当你使用搜索引擎的时候，往往只会留意最前面的几个条目，所以不少网站都希望通过各种方式来影响搜索引擎的排序，吸引更多的人点进来。

GEO同SEO的原理一样，不过它针对的是生成式AI模型。

GEO通过提升品牌在AI生成答案中的可见性和引用优先级，使企业信息被AI算法识别为“可信来源”，从而在用户查询时获得优先推荐。

也就是“让AI觉得你好”。

这本身并没有触犯法律，如果一家企业使用真实内容让AI了解自己的产品，并将它推广给受众，这是正当营销。

但3·15晚会曝光的，是被滥用的黑产版本——用虚假信息对AI进行大批量投喂，让AI彻底沦为可以花钱购买的广告位。

“投毒”是如何做到的——RAG检索

在大模型被制造出来之前，工程师会给它“投喂”海量的互联网数据；而模型在这海量数据里学习语言规律和基础知识，并将这些数据永久保存。

但这些数据规模再大，终究也是有限的，起码不是最新的。于是工程师发明了RAG技术，即检索增强生成（Retrieval-Augmented Generation，RAG）技术。

RAG的核心，是知识库、检索器以及大语言模型本身。

正常情况下，用户提问后，检索器先从外部知识库中获取相关信息，再将用户查询的内容同检索到的相关知识一起，嵌套进预设的提示词模版中，最终生成答案。

通用检索增强生成架构（图源：论文《PoisonedRAG: Knowledge Poisoning Attacks to Retrieval-Augmented Generation of Large Language Models》）

这个系统的漏洞在于：检索器从外部知识库获取的信息，默认是准确可用的。

于是，攻击者可以通过污染检索器使用的数据语料库来操控系统，而且这类攻击很容易绕过现有防御机制。

这个漏洞有多严重？

2024年，来自美国伊利诺伊理工大学等机构的研究团队发布了一篇题为《PoisonedRAG: Knowledge Poisoning Attacks to Retrieval-Augmented Generation of Large Language Models》的论文，给出了一个令人震惊的实验结论：在包含数百万文本的数据库中，只需为每个目标问题注入5个精心构造的“有毒”文本，就可能达到90%的攻击成功率。