感谢抖总。我是北京人形机器人创新中心的熊友军。很高兴今天在百度Create大会的平台,与大家分享创新中心在具身智能领域的最新探索和实践。
先和大家分享一个令人振奋的消息。上个周末,我们团队研发的“天工”机器人,在北京亦庄半马比赛中,以2时40分42秒的成绩成功完赛,创造了历史,成为全球首个完赛半马的机器人跑者。
对于具身智能行业来说,马拉松不只是简单的体育竞技,更是对技术突破、产业发展的一次“极限测试”,验证人形机器人能不能连续自主、稳定地执行任务。
未来,机器人还将迎来更多这样的“里程碑”时刻!路途虽远,好在从不缺少同路人。百度智能云为创新中心提供了领先的产品和专业的服务,为具身智能的持续进化按下“加速键”。
北京人形机器人创新中心具备具身智能软硬件全栈技术积累,正在围绕通用机器人平台“天工”、通用具身智能平台“慧思开物”,打造具有全球影响力的具身智能创新策源地,以及具身智能应用示范高地。
先来看看通用机器人母平台“天工”。左侧的“天工2.0”是全尺寸的通用人形机器人,率先实现了国内首个针对复杂地形的自适应行走;右侧的“天轶2.0”是轮臂机器人,拥有轮式全向移动能力,在平地的作业环境中,移动更高效。二者均具备更强的人机交互、智能化水平,工业级上肢负载能力,更大的双臂末端稳态负重,动态作业精度达到毫米级。
今年3月,我们发布了全球首个“一脑多能”“一脑多机”的通用具身智能平台“慧思开物”,颠覆单一场景、单一任务做专项开发这一传统机器人应用开发模式,实现多本体兼容、多场景适应,具备强大的泛化能力。
它由两部分组成,包括由AI大模型驱动的具身“大脑”,以及由数据驱动的具身“小脑”。“大脑”负责任务规划,通过调用“小脑”技能库执行具体动作,并将执行反馈传递回“大脑”,形成任务闭环。
在“慧思开物”平台日常研发过程中,百度为我们提供了高性能、稳定可靠的AI基础设施,百度百舸在算力高效调度、模型训推加速等方面的产品技术积累,大幅提升了具身模型开发效率。
在具身“大脑”能力构建上,通过使用千帆大模型平台,和以文心大模型4.5为代表的领先模型能力,可实现自然语言指令的精准解析,并通过多模态信息融合与上下文理解,将复杂任务分解为可执行的子任务序列,提升决策效率和准确性。
未来,“慧思开物”平台也将实现N个场景适配,多构型机器人的适配,大幅减少开发时间,目前已在工业分拣、积木搭建、桌面整理、物流打包等场景进行应用。
基于“慧思开物”平台,天工已实现最高12公里/小时的奔跑。并可基于视觉感知移动,连续攀登百级台阶。通过雪地、草地、沙地等多种复杂地形。包括在高冲量干扰情况下,保持机器稳定运行。
长期、稳定的运动能力是人形机器人走进人类生活自主作业的关键技术基座,为人形机器人走进户外救援、进入不同非标场景奠定基础。机器人要想真正成为人类生产生活中的帮手,还需要高成功率、高泛化性、高灵巧性的具身操作能力,这是产业界、学术界技术攻关的重点方向。
基于“慧思开物”平台,机器人可实现自动错误处理,遇到失败或者意外情况,能够自动重新规划、执行,保证任务成功完成。可实现精准任务规划,基于文心大模型4.5等多模态大模型,针对感知结果,实现复杂任务精准规划,展现了具身智能在教育娱乐、精密制造等领域的应用潜力。实现精准识别与多技能操作,针对长程任务,完成精确的环境感知、物体识别和多技能调用。可以看到,在真实物流打包场景中,机器人从物品处理到包装封箱的全流程自动化操作。实现双臂协同,基于VLA模型实现双臂协同操作,完成开袋子、开柜子、打扫等灵巧操作。
不同于训练大语言模型时,已经拥有海量的互联网文本图像数据,高质量的具身智能数据,特别是跨模态融合的数据集,目前还非常稀缺。面对行业共性挑战,创新中心正在建设具身智能数据生产、采集、标注和存储一体化的国家级数据采集训练场,打造全球范围内规模最大、信息最稠密、最通用的具身智能数据集。
百度在自动驾驶等行业沉淀了规模化、专业化的AI数据采集和标注服务能力,在百度智能云数据服务团队的助力下,加速建设百万量级的高质量具身数据集。
目前,创新中心已完成了全链路具身数据闭环的突破,建立起多场景、多类型的数采基地,实现多本体、多任务数据采集,建设了全国首个具身智能机器人数据平台,并牵头制定具身智能行业相关标准。
同时,我们也在构建开源开放社区,围绕本体、数据、运动、工具链等方面,有序开源,推动整个行业生态繁荣发展。
在接下来的几年,不同形态的具身智能机器人将走入大家的生产生活,有望成为继个人计算机、智能手机、智能汽车后的下一代人机交互中心。我们这一代人,将有幸见证那些很早就存在于影视作品中的“人机共生”画面成为现实。北京创新中心将继续携手百度智能云,共同加速这一天的到来!
谢谢大家!