大语言模型和具身智体及自动驾驶 - 公众号 - 文章列表 - 历史文章

文章总数 1000+

51好读 › 专栏 › 大语言模型和具身智体及自动驾驶

讨论计算机视觉、深度学习和自动驾驶的技术发展和挑战

最新

CLONE：用于长距离任务的闭环全身人形机器人遥操作

大语言模型和具身智体及自动驾驶 · 公众号 · · 3 天前 ·

Genie Centurion：通过人工-回放-和-细化指导加速规模化真实世界机器人训练

大语言模型和具身智体及自动驾驶 · 公众号 · · 3 天前 ·

NORA：一个用于具身任务的小型开源通才视觉-语言-动作模型

大语言模型和具身智体及自动驾驶 · 公众号 · · 3 天前 ·

R2S2：通过现实世界现成的技能空间释放人形机器人的潜力

大语言模型和具身智体及自动驾驶 · 公众号 · · 3 天前 ·

GraspCorrect：通过视觉-语言模型引导反馈进行机器人抓握矫正

大语言模型和具身智体及自动驾驶 · 公众号 · · 4 天前 ·

TASTE-Rob：推进面向任务的手-目标交互视频生成，实现可通用的机器人操作

大语言模型和具身智体及自动驾驶 · 公众号 · · 4 天前 ·

GeoDrive：基于三维几何信息有精确动作控制的驾驶世界模型

大语言模型和具身智体及自动驾驶 · 公众号 · · 6 天前 ·

S4-Driver：具有时空视觉表征的可扩展自监督驾驶多模态大语言模型

大语言模型和具身智体及自动驾驶 · 公众号 · · 6 天前 ·

慢-中-快：快速操作与慢速推理统一的双-系统基础模型

大语言模型和具身智体及自动驾驶 · 公众号 · · 1 周前 ·

SwitchVLA：视觉-语言-动作模型中执行-觉察的任务切换

大语言模型和具身智体及自动驾驶 · 公众号 · · 1 周前 ·

DexMachina：双手灵巧操作的功能重定向

大语言模型和具身智体及自动驾驶 · 公众号 · · 1 周前 ·

ForceVLA：利用力-觉察 MoE 增强 VLA 模型以实现丰富接触的操作

大语言模型和具身智体及自动驾驶 · 公众号 · · 1 周前 ·

LoHoVLA：面向长范围具身任务的统一视觉-语言-动作模型

大语言模型和具身智体及自动驾驶 · 公众号 · · 1 周前 ·

SLAC：用于全身真实世界强化学习的模拟预训练潜动作空间

大语言模型和具身智体及自动驾驶 · 公众号 · · 1 周前 ·

SmolVLA：经济高效的机器人视觉-语言-动作模型

大语言模型和具身智体及自动驾驶 · 公众号 · · 1 周前 ·

OG-VLA：通过正交图像生成的 3D-觉察视觉-语言-动作模型

大语言模型和具身智体及自动驾驶 · 公众号 · · 1 周前 ·

以人类演示视频为提示，学习可泛化的机器人策略

大语言模型和具身智体及自动驾驶 · 公众号 · · 1 周前 ·

DexUMI：以人手为通用操作界面，实现灵巧操作

大语言模型和具身智体及自动驾驶 · 公众号 · · 1 周前 ·

通过基于流视频预测的可泛化双手操作基础策略

大语言模型和具身智体及自动驾驶 · 公众号 · · 1 周前 ·

Impromptu VLA：用于驾驶视觉-语言-动作模型的开放权重和开放数据

大语言模型和具身智体及自动驾驶 · 公众号 · · 1 周前 ·

移动版

51好读 - 微信公众号文章