下载客户端

清华教授周伯文：ChatGPT对话框只是表象，本质是新交互范式

澎湃新闻记者张静

2023-02-16 14:10

来源：澎湃新闻

听全文

·ChatGPT带来了两个新进展：交互是一种学习手段而不仅仅是应用；在大模型训练中，当模型参数达到一定规模，人的反馈价值远超模型参数和计算量的价值。ChatGPT的核心进展是与人的协同和交互学习能力提升，而不只是模型变大，这对产品创新、人机协同创新、知识发现意义巨大。

·提升AI系统的协同与交互智能能力，让AI通过交互学习人的意图、做复杂推理，通过协同让人更擅长做决策，是未来人工智能的发展方向。AI如何更好适应人类并持续学习是未来研究重点之一，以ChatGPT为例，如何通过边缘端的小模型与人交互学习，进而将知识传递给云端大模型进行迭代，目前仍是研究空白，而这种“协同交互智能”带来的一个好处是低成本迭代，不需要每训练一次就花500万美元。

聊天机器人ChatGPT最近很热闹。脱离ChatGPT的聊天对话框，背后的本质是人机交互范式和底层AI能力的改变。从过去的围棋人工智能程序AlphaGo，到如今的聊天机器人ChatGPT，人工智能的发展趋势是聚焦提升AI系统的协同与交互智能能力。

清华大学惠妍讲席教授、清华大学电子工程系长聘教授、北京衔远科技创始人周伯文2月15日对澎湃科技（www.thepaper.cn）表示，ChatGPT的核心能力是通过协同交互完成任务。实际上，ChatGPT产品的对话框只是一个表象，本质是实时融合人的能力的协同交互智能，极大促进人机共创。在生产力场景下，这种交互范式可以改变行业。

周伯文拥有丰富的前沿研究经历与业界经验，他曾任IBM Research人工智能基础研究院院长、IBM Watson Group首席科学家、IBM杰出工程师、京东集团高级副总裁、集团技术委员会主席、云与AI总裁，2022年从工业界回到学术圈。其研究领域包括语音和自然语言处理、多模态与知识表征、理解、生成、推理、人机对话、可信赖AI等。他提出的自注意力融合多头机制的自然语言表征机理后来成为Transformer架构的核心思想之一，他还提出了AIGC领域的两个自然语言生成模型架构与算法。

ChatGPT提供了“系统1”和“系统2”联合共创的可能

2002年诺贝尔经济学奖得主丹尼尔·卡尼曼的一本畅销书《思考，快与慢》（《Thinking Fast And Slow》）提出了人的思考方式有两类：“系统1”和“系统2”。“系统1”的特点是基于直觉和经验判断，快速、不需要大量计算，“系统2”的特点是有语言、算法、计算、逻辑。

以人脑活动为例，国际象棋大师下车轮棋是“系统1”形式，他们并非仔细计算走哪步，而是凭借几万小时的训练和记忆力，从棋盘格局通过模式识别判断落子位置，这是通过直觉和记忆的低认知负担的决策。“系统2”的典型案例就是高考数学，哪怕是图灵奖得主或菲尔兹奖得主也不可能瞄一眼题目就能把考卷做出满分，而是必须认真读题、计算、推理认证、得出结果，这需要调动知识、计算、逻辑与检验，是一个高认知负荷的脑力推导的过程。

清华大学惠妍讲席教授、清华大学电子工程系长聘教授、北京衔远科技创始人周伯文。

从人工智能发展的进程来看，最初，人们认为AI更适合做“系统1”的工作，比如人脸识别、质检就是基于“系统1”的模式识别，“前段时间深度学习热下的产业落地很多人聚焦在这个方向，但很快就证明这个方向的价值天花板不高。”周伯文表示，从过去的AlphaGo，到如今的ChatGPT，AI在技术发展下会更越来越擅长“系统2”任务，并且能力增长的速度会超过我们原来的预期。不得不承认，人类单独做“系统2”的工作，从长远来看，学习的效率、深度、广度都不如AI，而需要去充分发挥AI的潜力。

AI的更多高价值场景在于“系统2”。因此，在以人为中心、人类更多承担“系统1”任务并负责最终决策、AI系统更多承担“系统2”任务的繁琐推导背景下，人和AI如何更好地协同和交互？“系统1”和“系统2”如何合作？如何持续提升AI系统的协同与交互智能能力？周伯文表示，让AI通过交互学习更好理解人的意图与判断、大量获取相关信息与数据并做复杂推理，为人呈现推理过程与决策选项，通过这些协同交互帮助人更擅长做决策、做更好的决策，这是未来人工智能发展的重要方向。

人可以借助AI更快发现新知识，洞察深度和广度，并完成任务。新知识的发现帮助人类设计出更好的AI，比如对脑科学的发现，计算优化的发现。人类发现更好的人工智能，更好的人工智能发现更多新知识，如此形成回路，一个创造新知识的飞轮就出现了。

1月份，《自然》封面文章提到，过去几十年来，全世界论文和专利数量大幅增加，但突破性创新越来越少。周伯文认为，原因之一在于，学科经过多年高速发展后形成了信息茧房。信息茧房内部，信息过载。每个人需要学习很多知识才能理解一个很小的子领域，没有突破性进展也就意味着学习新知识的同时也必须学习旧知识，学习成本越来越高。茧房与茧房之间，信息壁垒过高。由于信息过载与壁垒高企，纯粹靠科学家本人跨领域交叉难度越来越高，因此导致突破性进展也越来越少。

ChatGPT提供了一种“系统1”和“系统2”联合共创的可能，人与AI通过协同交互完成任务。在这个逻辑下，就像人类和ChatGPT的交互一样，如果将“系统1”和“系统2”结合起来，就能更高效打破信息茧房，在茧房内，人类能更快速学习、洞察，不同学科之间可以更好创造交叉知识。

实际上，ChatGPT产品只是一个表象，脱离ChatGPT的聊天对话框，这是人机交互范式和底层AI能力的改变，在生产力场景下，这种交互范式可以改变行业。

周伯文表示，ChatGPT的核心进展是AI与人的协同和交互学习能力提升，而不仅仅是模型变大。这对产品创新、人机协同创新、知识发现意义尤其巨大。基于这样的预见，他在2021年底创立了衔远科技，利用多模态的表征和推理技术帮助企业快速定位以消费者为中心的高潜机会赛道和产品创新机会点。

交互是学习手段，人的反馈价值远超模型参数

一直以来，对话式AI存在三大局限，包括AI系统缺乏常识，缺乏对世界的认知模型和对演绎机理的理解；对话式AI缺乏实时的推理归纳和学习能力；此外，对话式AI缺乏驾驭对话的能力。ChatGPT出现后，这三大局限仍然存在，比如ChatGPT缺乏对话策略能力，不会主动寻求信息、反问人类。

但ChatGPT带来了两个新进展。第一，交互是一种学习手段而不仅仅是应用。过去，人工智能客服只是机械式回答问题，听不懂人的意图反馈，它的目的是完成任务而非学习。“ChatGPT能在很长的对话里，把上下文问到的问题、表达、纠正变成一种学习输入，帮助它更好地回答问题、意识到自己的错误、修正自己的答案。”这恰好证明了周伯文提出的协同与交互的重要性，人的反馈帮助ChatGPT在大模型中迅速定位知识，甚至反其道而行，选择一个概率更低的回答。

第二，在大模型训练中，当模型参数达到一定规模，人的反馈价值远远超过模型参数和计算量的价值。ChatGPT出现前，业界普遍认为，模型参数规模和计算量非常重要。不断喂数据，增加模型参数和迭代次数，模型效果就越好。但更多的数据意味着更多的计算量和能源消耗。ChatGPT的出现证明，人的反馈同样可以迅速提升模型的能力。

OpenAI在发布ChatGPT之前，对比过1750亿参数的GPT-3模型和13亿参数的InstructGPT模型。如果要求AI为一个6岁的小孩解释登月，以GPT-3的基础模型能力可以有各种角度回答这个问题，包括基于物理原理的万有引力，基于历史背景的美苏冷战促进登月，基于天文学角度的地月关系，也可以基于人类的关于月亮的神话传说与朴素愿望。“找到这些信息并不难，难的是GPT-3不知道哪个答案更适合。常规模式是按照出现概率排序。”但InstructGPT在这个基础上让用户对四类答案进行选择、打分，给出排序后，这些反馈可用于微调GPT-3模型，将GPT-3与人类的意图和评价体系进行对齐，进而改变模型参数和推理结果。

“在这些与人的交互协同后，如果再要求ChatGPT为6岁孩子写童话，它就会自己学会以once upon a time（很久以前）来开头，因为它认识到6岁的小孩有独特的需求。这也是大家开始开玩笑说ChatGPT有情商的原因。”周伯文表示，它通过人的反馈调整模型内部隐式知识对应的参数，同时将人的思考与价值判断嵌入到系统，这也印证了交互是一种学习手段而不仅仅是应用。

1956年夏天，美国达特茅斯学院举行了历史上第一次人工智能研讨会，这被认为是人工智能诞生的标志。此后，人工智能的发展经历了“三起三落”。到如今，人工智能逐渐开始往“大一统”方向发展，周伯文表示，越来越多的任务会运用大规模预训练生成式模型，足够多的数据可以训练一个足够强的通用模型。但当前对知识的定位、编辑、可信度，以及对知识的矛盾处理和检测仍然不足，当越来越多的知识汇入大模型，大模型如何与知识更好融合是一个重点研究方向。

在“系统1”和“系统2”背景下，AI如何更好适应人类并持续学习是另一个研究重点。以ChatGPT为例，人类的反馈让ChatGPT只在推理时纠正当下的对话，但这些纠正没有融合大模型中。“云端里的大模型是固定的。边缘端有百万终端搜集信息，这些小模型不断跟人迭代交互，学到了新知识，这些新知识如何有效传到云端，改变云端大模型，目前还是研究空白。”

换句话说，就是要用小模型与人交互学习，进而将知识传递给云端大模型进行迭代。这种“协同交互智能”带来的一个好处是低成本迭代，“不需要每训练一次就花500万美元。”