当仿真环境的真实性逼近物理世界,当场景构建的效率以“自然对话”和“分钟”来衡量,具身智能的研发范式将发生根本性改变。智元机器人在CES国际消费电子展首日正式发布首个大语言模型驱动的开源仿真平台——Genie Sim 3.0。基于NVIDIA Isaac Sim ,Genie Sim 3.0融合三维重建与视觉生成,打造数字孪生级的高保真环境;首创大语言模型驱动的场景泛化技术,让万级场景的生成只需几分钟;同步开源包含真实机器人作业场景的上万小时仿真数据集;并构建了覆盖10万+场景的多维度智能评估体系,为模型能力绘制全景画像。
从数字资产生成、场景泛化、数据采集到自动评测的全流程功能,这一整套完整闭环的解决方案,将显著加速模型训练验证,降低对物理硬件的依赖,助力开发者与研究者的研发效率,推动具身智能的创新应用。
Github
github.com/AgibotTech/genie_sim
Modelscope
modelscope.cn/datasets/agibot_world/GenieSim3.0-Dataset
项目主页
agibot-world.com/genie-sim
点击尾部阅读原文跳转项目主页
传统仿真难以兼顾视觉逼真与物理真实。Genie Sim 3.0开创性地将三维重建、视觉生成技术与物理引擎深度融合,实现了视觉真实感与物理精确性的统一。
精准重建:依托 MetaCam手持3D激光扫描仪,结合高分辨率RGB、360° LiDAR点云与厘米级RTK定位,实现对真实环境的毫米级精准复刻。
视觉增强:利用视觉生成模型,智能合成新视角图像增强3D重建,极大提升了仿真环境的视觉逼真度。
资产生成:对于任意物体,仅需一段60秒环拍视频,即可快速生成带精确网格的仿真模型,大幅提升场景构建效率。
告别手动编写复杂逻辑的场景生成方式,在Genie Sim 3.0平台中,开发者输入自然语言指令即可驱动平台在分钟级内自动生成、泛化成千上万个训练与测试场景。
具身领域最大规模开源仿真数据集,涵盖200余项任务、总时长上万小时,为模型研发提供坚实的数据基石。
多维度数据:数据集包含RGB-D、双目视觉、全身关节状态等多传感器信息,并覆盖背景、布局、光照、噪声等多种泛化维度。
智能采集工具:平台提供低延迟遥操作与自动任务编排双模式采集,结合自动化标注实现高效数据生产。
独创错误恢复机制:任务失败后可自动回退至关键节点续采,将数据采集损耗降至最低。
零样本Sim2Real:仿真数据训练完成后,实现零样本迁移到真实世界,任务成功率超过真实数据训练。
模型评估不再仅限于“成功率”。Genie Sim Benchmark 3.0 构建了基于 10万+ 仿真场景的立体评估体系,结合LLM与VLM技术,从多个维度为模型绘制深度能力画像,是当前业界覆盖最全面、最权威的具身智能模型评估基准。
基于智元的规模化商用和工业落地经验,Genie Sim 3.0 是首个深度集成真实作业场景仿真数采与评测的开源平台,打通从实验室算法到工业应用落地。
今天Genie Sim 3.0 仿真平台将核心代码、海量高价值数据集以及数字资产全面开源,向全球开发者、研究者与产业伙伴开放。无论您是高校实验室的研究者,还是具身智能领域的算法工程师,或是来自制造业、物流业等领域的集成应用专家,Genie Sim 3.0 都将成为您研发、测试与验证的得力助手,为开发者搭建起 “所思即所得” 的创新舞台,让复杂的机器人开发变得更高效、更普惠,持续夯实通用机器人生态的数字基石。
2026年是具身智能规模化部署的关键之年,也是生态共荣的新起点。新年伊始,愿我们以 Genie Sim 3.0 为纽带,汇聚全球创新力量,在虚拟与现实的交融中突破更多可能,让智能机器人成为改变世界的新生产力。
祝每一位开发者灵感迸发、成果丰硕,与智元一同奔赴 “万级部署、亿级生态” 的崭新未来!