迈向群体智能 | 智源发布首个跨本体具身大小脑协作框架与开源具身大脑

AI科技评论 · 公众号 · 机器人 · 2025-03-30 09:30

主要观点总结

智源研究院发布了跨本体具身大小脑协作框架RoboOS及开源具身大脑RoboBrain，旨在加速具身智能跨本体协作与规模化应用。该框架实现了从单机智能到群体智能的跃迁，具有任务规划、可操作区域感知和轨迹预测等能力。RoboOS作为统一底座，支持多机器人系统的端云协同能力，具备高可扩展性与低时延响应能力。

关键观点总结

关键观点1: 跨本体具身大小脑协作框架RoboOS的发布。

RoboOS基于“大脑-小脑”分层架构，通过模块化设计、智能任务管理和跨本体协作，为机器人提供高效、灵活、可扩展的底层支持。

关键观点2: 具身大脑RoboBrain的功能。

RoboBrain负责全局感知与决策，构建动态时空感知、规划指导和反馈纠错机制，与小脑技能库的高效执行能力深度结合，确保协作框架在长周期、高动态任务中的稳定运行。

关键观点3: RoboOS及RoboBrain在机器人任务中的应用。

在递送苹果和水果刀的任务场景中，基于RoboOS及RoboBrain，多个机器人可以分工协作，实现复杂场景下的智能协作。此外，系统还具备动态管理多机器人任务队列的能力，支持优先级抢占与资源优化分配。

关键观点4: RoboOS的其他特点和优势。

RoboOS可动态管理任务规划并优化策略，通过共享记忆系统实现多个机器人之间的状态同步与智能协作。此外，系统具备高度扩展性与可迁移性，为未来具身智能的规模部署与生态构建奠定了基础。

正文

请到「今天看啥」查看全文

在任务规划方面，RoboBrain在不牺牲通用能力的前提下，在机器人规划评测集OpenEQA、ShareRobot（自建）和RoboVQA上多个维度优于GPT-4V、Claude3等6个当时领先的闭源/开源MLLMs。

RoboBrain在具身规划评测基准上的性能

在可操作区域感知方面，RoboBrain在AGD20K测试集上的平均精度超过了当时最先进的开源模型Qwen2-VL，验证了其在指令理解和物体属性方面的卓越能力。

RoboBrain在可操作区域感知基准上的性能

RoboBrain在轨迹预测基准上的性能

在轨迹预测方面，RoboBrain预测的操作轨迹具有与真实轨迹较高的相似度，展现了其在轨迹预测中的高精度和稳定性。RoboBrain的未来迭代版本会持续提高轨迹预测的能力。

目前，RoboBrain能够解读人类指令和视觉图像，以生成基于实时图像反馈的行动计划和评估，预测每一步的轨迹并感知相应的可操作区域。具体而言，RoboBrain 能够有效利用环境信息和交互对象的状态——无论是从第一人称还是第三人称视角捕捉的图像——生成针对不同类型机器人操作任务的任务规划，并基于人类指令和视觉信息，提供合理的可操作区域，并能在不同场景中表现出良好的泛化能力，生成既可行又合理的轨迹。

具身大脑RoboBrain、小脑技能库以及跨机器人数据中枢，是跨本体框架RoboOS 的核心要素。具身大脑RoboBrain，负责全局感知与决策，构建动态时空感知、规划指导和反馈纠错机制；小脑技能库，负责低延迟精准执行，实现柔性与精密操作等；跨机器人数据中枢，负责实时共享空间、时间和本体记忆，为决策规划与优化协作操作提供信息支持，从而形成感知-认知-决策-行动的闭环。

一脑多机实现跨本体协作，从单体智能迈向群体智能