智元发布首个通用具身基座大模型GO-1

鞭牛士 2025-03-10 10:08

3月10日，据“智元机器人”官微，智元今天正式发布首个通用具身基座模型——智元启元大模型（Genie Operator-1）。

据介绍，它开创性地提出了Vision-Language-Latent-Action (ViLLA) 架构。

该架构由VLM(多模态大模型) + MoE(混合专家)组成，其中VLM借助海量互联网图文数据获得通用场景感知和语言理解能力，MoE中的Latent Planner(隐式规划器)借助大量跨本体和人类操作视频数据获得通用的动作理解能力，MoE中的Action Expert(动作专家)借助百万真机数据获得精细的动作执行能力。

三者环环相扣，实现了可以利用人类视频学习，完成小样本快速泛化，降低了具身智能门槛，并成功部署到智元多款机器人本体。

扫码下载app 最新资讯实时掌握

智元机器人 大模型

上一篇婉拒采访后，「雷军又挂了三条热搜」上热搜

下一篇对话尤洋：「部署DeepSeek月亏4亿」争议背后，潞晨不想参与MaaS肉搏战