专栏名称: AI前线
InfoQ十年沉淀,为千万技术人打造的专属AI公众号。追踪技术新趋势,跟踪头部科技企业发展和传统产业技术升级落地案例。囊括网站和近万人的机器学习知识交流社群。
目录
相关文章推荐
财联社AI daily  ·  AI搜索“新贵”查询量增长超20% ·  昨天  
缠弟投研  ·  大摩提前剧透DeepSeek R2!! ·  昨天  
缠弟投研  ·  大摩提前剧透DeepSeek R2!! ·  昨天  
黄建同学  ·  可能搞到机器人怀疑机身//@karminsk ... ·  昨天  
51好读  ›  专栏  ›  AI前线

王兴兴回应比赛风波:挣到钱了,但现在的机器人别指望它能干活

AI前线  · 公众号  · AI  · 2025-06-06 19:50

主要观点总结

本文是关于机器人技术发展的讨论,包括机器人比赛、机器人载体选择、VLA技术瓶颈等问题。多位专家就机器人的发展趋势、技术难点、市场前景等话题进行了深入探讨。文章提及人形机器人在未来的应用前景及其面临的挑战。

关键观点总结

关键观点1: 机器人比赛的意义和现状

机器人比赛是展示机器人技术发展的重要平台,通过比赛可以推动机器人技术的进步和创新。近期,各种机器人赛事如火如荼,对于机器人的发展起到了积极的推动作用。

关键观点2: 人形机器人在未来应用的前景和挑战

人形机器人在未来市场中有巨大的应用潜力,特别是在商用服务场景和家庭领域。然而,人形机器人的研发也面临着技术挑战和成本压力。

关键观点3: 关于VLA技术的讨论

VLA技术在机器人领域具有广泛的应用前景,但也需要突破一些技术瓶颈。专家们就VLA技术的未来发展、算法提升、数据需求等问题进行了深入探讨。


正文

请到「今天看啥」查看全文


王仲远: 谢谢友军,王鹤老师更是智源好朋友,2021 年王老师从斯坦福回到北大任教,现在是智源研究中心的负责人。2023 年王老师创立了北京银河通用机器人有限公司,今年非常恭喜王老师成为了 MIT 主办方。王老师做的银河通用机器人模型,最新有什么新的进展?

王鹤: 谢谢王仲远博士的介绍。今年是银河通用机器人第二次亮相智源大会,去年在智源大会我们展示了盒装物体在货架上的吸取,今天用 VLA 技术,也是刚刚 Physical Intelligenc 提到的端到端具身大模型打造了适用性更强,更贴近一般商超的货架场景。下面我也展示一下跟 Galbot 模型的互动。

image

王鹤:我中午又饿又热,Gbot 给我搞点吃的和喝的。

机器人:根据您提到的,为您推荐安慕希酸奶和果粒爽果冻,您想要哪个?

王鹤:成年人不做选择,我都要。

我们在现场用的是基于自研端到端大模型的轮式底盘人形机器人,能够取下货架琳琅满目的各种各样货品,这个模型是闭环的,拿的过程中你抢,它也会抓,它没办法在非常密集的货架上规避碰撞。我们的技术特点是,背后的训练数据主要是合成数据,价格非常低廉,是可以扩增的。

王仲远: 谢谢王老师。卢老师,去年 3 月份时我们在上海交大第一次见面,当时我印象很深,您所展示的叠衣服、刮胡子,基于力反馈的具身智能系统非常厉害,不知道最近有没有什么新的进展?

卢策吾: 从产品的角度来讲,去年发布了穹彻大脑 V1 版本,马上在 7 月份会发布 V2 版本。这里体现了对于世界物理的理解和交互。

为什么会有力反馈呢?在做很多动作时,其实人都是下意识的,这对于什么样经济价值比较高的场景会有用呢?需要复杂动态的接触和操作。比如刮胡子就很典型,机器人抓取之后,基本固定不动了,但是要连续不停地跟皮肤接触,那力气大一点会刮伤皮肤,力气小一点会刮不干净,所以它适用于鲁棒性极高、要模仿人类下意识的环境。

刮胡子有点炫技,其实我们很早已经把它应用到实际场景中了。我们在很多食品加工、处理行业里已经批量化落地了,可能你们吃的食品是我们机器人在背后做的。食品是高密度、高持续的接触,同时对于物理的理解会有更大的难度,但是拓展到生活场景是非常必要的,比如将来可以照顾人、帮你擦脸,有很多跟人的交互,应用到生活场景也是必需的,所以我们的模型就用了力和位置,也是全球唯一用力和位置反馈的大模型。

王仲远: 谢谢卢老师。Karol Hausman,Physical Intelligence 在中国是非常受欢迎和被关注的,每次只要发布模型或视频都有大量的转发,包括π0、π0.5、Hi Robot 都在中国得到了大量的关注。您刚才有没有看到现场机器人的表演,包括卢老师所展示的精细化的操作,也想请您介绍一下 Physical Intelligence 最新的具身机器人和具身模型的能力有什么新的进展?

Karol Hausman: 非常感谢您提的这个问题,我也意识到这一点。确实看到很多人都比较关注π和 Physical Intelligence,我们也愿意给大家提供更多的模型,这样能够让全球的机器人承担更多有效的任务。关于π0.5 模型,这是我们感到非常骄傲的地方,之前我们认为很难让机器人在陌生的环境下完成相关的任务,现在发现这是大家都面临的挑战。

家庭是非常复杂的环境,每个人的家庭都不一样,如果能够把机器人带到一个之前从来没有去过的家庭,之后来完成任务,这将是非常重要的突破。因为每个工厂都比较类似,但家庭场景各不相同,所以我们开始关注要有多少多元化的数据才能够帮助机器人在陌生环境下完成任务。

我们有上百个不同的家庭环境,生成了上百个不同家庭的数据。其实,机器人并不是每次都会完美地完成任务,也会有这样或那样的失误,但确实展现出非常大的潜力,机器人并不需要考虑数据集的多元性才能实现最终的泛化。我们现在还处在整个研究的初级阶段,但是这个研究领域确实有很大的前景。

机器人赛事是秀肌肉 or 验证场?

王仲远: 今年具身智能比较破圈,一个主要原因是近期各种各样的机器人赛事,比如马拉松、格斗比赛以及今年 8 月将在北京举办的世界人形机器人运动会,我想听听各位朋友对于这些赛事活动怎么看?它们是技术的验证场还是秀肌肉的表演?有没有可能拉高公众对于机器人能力的预期?

王兴兴: 从今年 1 月的春晚到格斗比赛,我觉得最大的点是,确实给大众提供了一个很好的展示平台,并且更早地让大家接触到了目前机器人的发展。但因为比赛很多,有些企业参加,有些企业没参加,这是不可避免的一件事,每家企业还有各自的特点。

像我们的话,终极目标还是希望机器人是干活的,无论是家里还是工厂。但 如果让一个人体机器人或者智能机器马上去家里干活,最近几年还是不太现实的 。大家可能觉得我们公司的机器人就在做跳舞或者打比赛格斗这类事情,实际上,我们的真正理念是希望人形机器人可以做各种动作,无论是跳舞、格斗,还是在家端茶倒水、洗衣做饭,都是全身动作的一部分。

所以我一直相信的是,当 AI 技术,包括具身智能发展到一定阶段时,一个足够智能的家用机器人肯定是可以做跳舞、打格斗这类事情的。我们的目标一直是希望通过 AI 技术让机器人能做各种全身动作,然后来实现终极目标,解放人类的生产力,尤其是去从事一些辛苦的工作。但在终极目标没有实现之前,我们先参加一些表演和格斗比赛来给大家展示下机器人的情况,并且产生一部分的商业价值。像今年上半年,人形机器人的租赁市场比较火爆,已经带来了一些产业价值。







请到「今天看啥」查看全文