专栏名称: AI科技评论
点评学术,服务 AI !
目录
相关文章推荐
51好读  ›  专栏  ›  AI科技评论

迈向群体智能 | 智源发布首个跨本体具身大小脑协作框架与开源具身大脑

AI科技评论  · 公众号  · 机器人  · 2025-03-30 09:30

主要观点总结

智源研究院发布了跨本体具身大小脑协作框架RoboOS及开源具身大脑RoboBrain,旨在加速具身智能跨本体协作与规模化应用。该框架实现了从单机智能到群体智能的跃迁,具有任务规划、可操作区域感知和轨迹预测等能力。RoboOS作为统一底座,支持多机器人系统的端云协同能力,具备高可扩展性与低时延响应能力。

关键观点总结

关键观点1: 跨本体具身大小脑协作框架RoboOS的发布。

RoboOS基于“大脑-小脑”分层架构,通过模块化设计、智能任务管理和跨本体协作,为机器人提供高效、灵活、可扩展的底层支持。

关键观点2: 具身大脑RoboBrain的功能。

RoboBrain负责全局感知与决策,构建动态时空感知、规划指导和反馈纠错机制,与小脑技能库的高效执行能力深度结合,确保协作框架在长周期、高动态任务中的稳定运行。

关键观点3: RoboOS及RoboBrain在机器人任务中的应用。

在递送苹果和水果刀的任务场景中,基于RoboOS及RoboBrain,多个机器人可以分工协作,实现复杂场景下的智能协作。此外,系统还具备动态管理多机器人任务队列的能力,支持优先级抢占与资源优化分配。

关键观点4: RoboOS的其他特点和优势。

RoboOS可动态管理任务规划并优化策略,通过共享记忆系统实现多个机器人之间的状态同步与智能协作。此外,系统具备高度扩展性与可迁移性,为未来具身智能的规模部署与生态构建奠定了基础。


正文

请到「今天看啥」查看全文


任务规划 方面,RoboBrain在不牺牲通用能力的前提下,在机器人规划评测集OpenEQA、ShareRobot(自建)和RoboVQA上多个维度优于GPT-4V、Claude3等6个当时领先的闭源/开源MLLMs。

RoboBrain在具身规划评测基准上的性能

可操作区域感知 方面,RoboBrain在AGD20K测试集上的平均精度超过了当时最先进的开源模型Qwen2-VL,验证了其在指令理解和物体属性方面的卓越能力。

RoboBrain在可操作区域感知基准上的性能


RoboBrain在轨迹预测基准上的性能


轨迹预测 方面,RoboBrain预测的操作轨迹具有与真实轨迹较高的相似度,展现了其在轨迹预测中的高精度和稳定性。RoboBrain的未来迭代版本会持续提高轨迹预测的能力。

目前,RoboBrain能够 解读 人类指令和视觉图像 ,以 生成 基于实时图像反馈的行动计划和评估, 预测 每一步的轨迹并 感知 相应的可操作区域。具体而言,RoboBrain 能够有效利用环境信息和交互对象的状态——无论是从第一人称还是第三人称视角捕捉的图像——生成针对不同类型机器人操作任务的任务规划,并基于人类指令和视觉信息,提供合理的可操作区域,并能在不同场景中表现出良好的泛化能力,生成既可行又合理的轨迹。

具身大脑RoboBrain、小脑技能库以及跨机器人数据中枢 ,是跨本体框架RoboOS 的核心要素。具身大脑RoboBrain,负责全局感知与决策,构建动态时空感知、规划指导和反馈纠错机制;小脑技能库,负责低延迟精准执行,实现柔性与精密操作等;跨机器人数据中枢,负责实时共享空间、时间和本体记忆,为决策规划与优化协作操作提供信息支持,从而形成感知-认知-决策-行动的闭环。



2

一脑多机实现跨本体协作,从单体智能迈向群体智能






请到「今天看啥」查看全文