- +1
科技展望开年演讲|擎朗智能刘斐:“通专结合”将进一步推动具身智能广泛落地
在“机器人已经能后空翻跳舞”的热闹叙事之外,具身智能距离真正进入真实世界,仍存在大量“不能”的现实问题。
1月29日,在澎湃新闻(www.thepaper.cn)于上海举办的“2026科技展望开年演讲”上,上海擎朗智能科技股份有限公司(以下简称“擎朗智能”)战略技术官刘斐围绕“具身智能的能与不能”展开分享。
刘斐指出,在真实商业和服务场景中,多形态机器人的协作,可能比单一追求人形更具现实意义。在他看来,如何让机器人在非结构化环境中稳定工作、与人和其他机器人协同配合,依然是具身智能迈向落地的关键挑战。擎朗将以“通用+专业”结合,进一步推动具身智能的广泛落地。
刘斐同时强调,在接下来一年里,强化学习仍将是人形机器人能力提升的关键方式;同时,行业不应简单否定遥控和遥操作的价值——在当前阶段,这更像是“扶着机器人往前走”,是帮助机器人学习和成长的必要过程。

以下是刘斐的演讲(略有删减):
非常荣幸在这里跟大家分享一下我们对具身智能的一些理解,今天我分享的主题是“具身智能的能与不能”,我们对具身智能的认知存在两个矛盾的方面,一个它在一些运动性能方面很能,但是离我们想要它做到的其他事情又有很大的差距,存在很多的不能。能与不能,如何合理地看待它?
什么是具身智能
首先给具身智能一个定义,来自中国计算机学会计算机术语审定工作委员会给出的学术定义。具身智能是指一种基于物理身体进行感知和行动的智能系统,其推动智能体与环境的交互来获取信息、理解问题、做出决策,并实现行动,从而产生智能行为和适应性。
具身智能和传统的人工智能有什么不同?
具身智能特别强调物理身体。所有的感知和行动,包括决策都基于物理身体的能力来实现。
它又是与环境强交互的。具身智能跟之前的智能技术最大的不同在于前者具备 “泛化能力”和“物理世界交互能力”,学习的是一部分知识,但能处理更多的事情,并通过机械臂等装置,与物理世界交互。
图灵在1950年发布的 “计算机器与智能”的论文中有一句非常著名的话“与其试图编程模拟成人大脑,不如模拟儿童大脑”,这篇论文里对智能的方向给到两个不同的路线:一种是具身智能一定要跟物理实体在一起,进行交互和学习;第二种被称为离身智能,它是一个运行于云端的程序、运行于电脑上的APP。从1950年到现在,具身智能的概念和技术跟机器人本体的结合度越来越高。
我们把机器人通常分为三类:
第一类是工业机器人,在工厂里干一些重活,比如喷涂、打磨、焊接、切割等。第二类是特种机器人,更多应用于消防、搜救、排爆、侦察等,它的单体成本非常高,但能力也很强。第三类是生活中常见的服务机器人,比如家庭中的扫地机器人和商用服务机器人,这个领域也是擎朗深耕的方向。
人形机器人是机器人形态的分类方式,从形态来看,可以是人形机器人、四足机器人、轮式机器人,也可以是履带式机器人。从工作的场景看,可以是空中机器人、陆地机器人、水下机器人,甚至是多栖机器人。
现在我们看到的人形机器人能跳非常棒的舞蹈,这背后依赖的是强化学习技术。
在训练机器人模型时,给出一个清晰的指标,训练的过程中只要贴近于这个效果,我们给它正向的奖励,如果偏离或背离,我们就给它负向的评价,这就是强化学习。通过这个训练,我们可以让机器人不断沿着我们所期望的方向去做,从简单的运动到完成复杂舞蹈。
我相信在接下来一年里,强化学习依然是提升人形机器人能力非常重要的方式。
具身智能的不能
现在回答第二个问题,具身智能还有什么是不能的?
“具身智能的不能”在人工智能领域里有个非常有意思的悖论叫“莫拉维克悖论”,所描述的是人工智能能力两个不同的方向,人类所独有的高阶智能只需要非常少的算力,但某些无意识的技能和直觉却需要大量的运算能力。
人类和人工智能有两次非常著名的对抗。一是1997年IBM的深蓝战胜了当时的国际象棋冠军,二是2016年AlphaGo战胜了当时的世界围棋冠军。
看起来人工智能已经非常厉害,但到目前为止也没有哪一个人形机器人公司可以让机器人流畅地做到“开门”和“上下车”这两个对人类来说极其简单的动作,这就是莫拉维克悖论所描述的矛盾点。
此外,我想说一说如何理解遥控机器人这件事。我们说到遥控,一般涉及两个操作,一个是遥控,一个是遥操作。
遥控是通过遥控器,通常是双摇杆,或者是组合按键的方式,来发出指令控制机器人完成特定的动作,它解决的问题是什么?其实我们现在看到人形机器人也好,或者其他的机器人也好,所解决的是状态切换之间的一些能力的缺失。
很多人玩过遥控赛车,控制的是车辆的运行速度和方向,这辆车只受这两个变量的控制就能跑得很好。但人类遥控操作的不是机器人身上的那些电机。人形机器人的双腿和腰部一般有15个自由度,人不可能通过按钮或摇杆的方式同时控制好这15个电机,当我们控制摇杆让机器人前后左右移动的时候,其实是全身所有的电机在协调运动,它远比人类能达到的控制效率要高很多。
遥控机器人解决的问题是,当机器人需要上一个台阶时,人给它一个指令,告诉机器人前面是台阶,你要换一个高抬腿的步态。
我相信在不远的未来,伴随机器人大脑能力持续发展,机器人能准确地识别障碍物,准确地规划好自己下一步动作。
我觉得无论是遥控或是遥操作,我们现在在做的事情,相当于扶着机器人往前走,就像教一个小朋友一样,让他走好,遥控仅仅是我们在现阶段对机器人学习和发展提供的能力支持。
我们认为在现在的商业环境下需要选择一些工作让机器人做,这个工作有两个标准:一是工作流程可以被非常清晰地定义,二是对任务的效果有一个清晰的量化评价指标。擎朗目前便采取“岗位化”战略,通过积累岗位化能力,来推动人形机器人更快速更广泛地落地。
不管是做什么工作岗位,一些机器人必须具备的基本动作被梳理出来,比如抓、拿、端、放、擦拭、推拉等,这些就构成了机器人完成岗位化任务的原子动作集。
我们会训练机器人的模型,让它具备这样的操作能力。我们非常坚定地相信,在不远的将来,我们在生活中看到的具身智能机器人所表现的技术更多的是专用和通用的结合,通用机器人结合具身智能技术训练出来的效果,一定会让我们更快地感受到技术带来的进步。





- 报料热线: 021-962866
- 报料邮箱: news@thepaper.cn
互联网新闻信息服务许可证:31120170006
增值电信业务经营许可证:沪B2-2017116
© 2014-2026 上海东方报业有限公司




