• +1

智元GO-1模型正式开源;谷歌给机器人安上新大脑;宇树G1学会了反重力模式丨电波周报

2025-09-29 12:30
来源:澎湃新闻·澎湃号·湃客
字号

1. 智元机器人通用具身基座大模型 GO-1 正式开源

9 月 23 日,智元机器人宣布其通用具身基座大模型 GO-1(Genie Operator-1)正式在 GitHub 开源。

GO-1 的核心是 Vision-Language-Latent-Action(ViLLA)架构,即通过引入隐式动作标记,弥合图像-文本输入与机器人执行动作之间的语义鸿沟。

通俗解释就是:它先把「看见什么(视觉)、想干什么(语言指令)」抽象成一串低维的、具有语义的暗号(Latent Action),再通过一个专门的动作解码器把这个「暗号」翻译成机器人具体的关节运动指令(比如关节怎么转、手指怎么动等)。其核心优势源于三层协同设计的精妙逻辑:

VLM 多模态理解层:基于 InternVL-2B 构建,可以处理多视角视觉图片、力觉信号、自然语言指令等多模态信息,为系统提供场景感知与指令解读能力,是机器人「看懂世界、听懂需求」的基础。

Latent Planner 隐式规划器:作为「决策大脑」,通过预测隐式动作标记实现复杂任务的高层次规划和理解,例如接到「悬挂衣服」指令时,能先规划出「抓取衣领 - 定位挂钩 - 调整姿态」的动作逻辑。

Action Expert 动作专家:依托扩散模型生成高频率、高精度的连续动作序列,确保机器人完成拧瓶盖、叠衣物等精细操控任务,改善了传统模型动作僵硬、精度不足的痛点。

根据测试,GO-1 在 GenieSim 仿真评测、Libero 仿真评测和真机实验中都取得了不错的成绩,相比于其他 SOTA 模型保持领先。

2. 小米 17 正式发布,首发第五代骁龙 8 至尊版

9 月 25 日晚,小米秋季新品发布会召开,正式发布了小米 17 系列,处理器方面,小米 17 全系首发搭载第五代骁龙 8 至尊版,即骁龙 8 Elite Gen 5:由第三代 3 nm 工艺加持,架构全大核,主频达到了 4.6 GHz。

值得一提的是,第五代骁龙 8 至尊版是高通在 9 月 25 日早上刚刚发布的旗舰,所以小米 17 系列就成为了全球首款搭载第五代骁龙 8 至尊版的新机。

本次小米 17 系列包括标准版、Pro 和 Pro Max 三款机型。

在屏幕尺寸方面,小米 17 和 17 Pro 的尺寸为 6.3 英寸,Pro Max 则是 6.9 英寸。电池容量上,17 标准版为 7,000 mAh,Pro 为 6,300 mAh,Pro Max 为 7,500 mAh。

本次小米 17 系列最重要的改变就是小米 17 Pro 和 Pro Max 新增的妙享背屏,补充了手机交互的盲区。并且支持 120 Hz 刷新率,可以显示时间,也可以用来自拍、控制汽车等。

在 9 月 27 日正式开售后,据小米手机官方微博消息,小米 17 全系开售 5 分钟,刷新 2025 年国产手机全价位段新机系列,首销全天销量、销额纪录。

3. 宇树 G1 学会了「反重力」模式

9 月 22 日,宇树科技晒出了一段 G1 机器人解锁新技能的视频,G1 接受了工作人员的暴力测试,即便是被踢倒,G1 也很快就完成了起身。

这得益于 G1 新学会的「反重力」模式,即机器人在任意动作序列下,稳定性都有大幅度提升,哪怕是摔倒了,也能快速起身。

这对于机器人在应用时的稳定性提升非常明显,在实际应用场景中,地面状况复杂多变,碰撞等意外情况时有发生。在这些场景下,机器人如果不能快速恢复,不仅会严重影响工作效率,还可能导致设备损坏这类问题,所以机器人的稳定性非常重要。

而且在学会「反重力」模式后,G1 也有了解锁更多技能的可能性,未来可以继续期待机器人在运动端的表现。

4. 谷歌给机器人安上了新大脑

当地时间 9 月 25 日,谷歌核心 AI 研发部门 DeepMind 发布了为机器人打造的 Gemini Robotics 1.5 系列模型,该系列包括两种模型,分别是:

Gemini Robotics 1.5:是一款 VLA 模型,可以将视觉信息和指令转化为机器人执行任务的运动指令,跟传统 VLA 模型简单执行指令不同,它在执行动作前会先思考并展示过程,以此来评估并且完成复杂任务。而且其具备良好的跨形态学习能力,不需要根据不同本体形态来调整模型。

Gemini Robotics-ER 1.5:是一款 VLM 模型,可以对物理世界进行推理,可以调用数字工具并创建详细的多步骤计划来完成任务,目前该模型已经在学术和内部基准测试中实现了最先进的性能。

这两款模型都建立在核心 Gemini 系列模型之上,各自有不同的定位,但它们结合在一起协同运转的时候,也给机器人执行具体任务的时候解锁了智能体的体验。并且 Gemini Robotics 1.5 还有着不错的跨形态学习能力,不需要模型根据不同的本体进行额外的专门调整,可以很好地通过技能迁移学习来完成任务。

对于本次模型的发布,DeepMind 表示将通过 Google AI Studio 中的 Gemini API 向开发者提供 Gemini Robotics-ER 1.5,而 Gemini Robotics 1.5 目前只供部分合作伙伴使用。

5. 知行科技机器人控制器 iRC100 发布

近日,知行科技正式发布全球首款国产芯机器人通用控制器——iRC100。iRC100 基于地瓜机器人 S100P打造,多核异构 SoC 整合了 CPU、BPU、MCU。

在关键参数上:

CPU 采用 6 核心 ARM Cortex-A78AE,算力 137K DMIPS;

BPU 采用 Nash 架构,算力 128 TOPS(INT8);

MCU 采用 4 核心 ARM Cortex-R52+,算力 6.5K DMIPS;

GPU 采用单核心 ARM Mali-G78AE,算力 100G FLOPS。

并且 iRC100 控制器很多方便机器人厂商开发的接口:

6 个 USB 3.2 Gen 1,还有 2 个 USB 2.0;

4 路 EtherCat,2 个 2.5G RJ45 网口;

5 个 CANFD。

此外,在散热方案上, iRC100 控制器采用风冷,内置单个风扇。目前为止,知行科技机器人团队与地瓜机器人紧密合作,已将 VLA 模型 ACT Policy 算法,成功部署在地瓜机器人 S100P(128 TOPS)具身智能计算平台上,使其在 Hugging Face SO-101 机械臂上流畅运行,并以高成功率完成抓取、放置物体任务。

6. 乐享科技完成 2 亿元天使 ++ 轮融资

9 月 28 日,苏州乐享智能科技有限公司(下称「乐享科技」)正式宣布完成 2 亿元天使 ++ 轮融资。本轮融资由钟鼎资本领投,老股东 IDG 资本持续加注。这是乐享科技 9 个月内完成的第三轮融资,天使轮融资总金额接近 5 亿元。

资金将主要投入核心零部件自研、机器人本体与运动控制技术、意识仿生模型迭代等,目标加速消费级具身智能产品规模化落地。

乐享科技成立于 2024 年 12 月,是一家消费级具身智能企业,创始人郭人杰为 97 后,曾任追觅中国区执行总裁。

在产品方面,乐享科技已推出履带式机器人 W-bot,场景覆盖户外与公共空间,拓展零售、安防、娱乐等多元应用。

并且乐享科技介绍,团队正在同步开发 Z-Bot,这是一款高 60 厘米的小型家庭机器人,聚焦家庭场景,探索陪伴、教育、交互等场景,W-bot 和 Z-Bot 两者一起将构成乐享科技覆盖室内外的产品矩阵。

作者:小波

原标题:《智元 GO-1 模型正式开源;谷歌给机器人安上新大脑;宇树 G1 学会了反重力模式丨电波周报》

阅读原文

    本文为澎湃号作者或机构在澎湃新闻上传并发布,仅代表该作者或机构观点,不代表澎湃新闻的观点或立场,澎湃新闻仅提供信息发布平台。申请澎湃号请用电脑访问http://renzheng.thepaper.cn。

    +1
    收藏
    我要举报
            查看更多

            扫码下载澎湃新闻客户端

            沪ICP备14003370号

            沪公网安备31010602000299号

            互联网新闻信息服务许可证:31120170006

            增值电信业务经营许可证:沪B2-2017116

            © 2014-2026 上海东方报业有限公司