|
CLONE:用于长距离任务的闭环全身人形机器人遥操作 大语言模型和具身智体及自动驾驶 · 公众号 · · 3 天前 · |
|
|
Genie Centurion:通过人工-回放-和-细化指导加速规模化真实世界机器人训练 大语言模型和具身智体及自动驾驶 · 公众号 · · 3 天前 · |
|
|
NORA:一个用于具身任务的小型开源通才视觉-语言-动作模型 大语言模型和具身智体及自动驾驶 · 公众号 · · 3 天前 · |
|
|
R2S2:通过现实世界现成的技能空间释放人形机器人的潜力 大语言模型和具身智体及自动驾驶 · 公众号 · · 3 天前 · |
|
|
GraspCorrect:通过视觉-语言模型引导反馈进行机器人抓握矫正 大语言模型和具身智体及自动驾驶 · 公众号 · · 4 天前 · |
|
|
TASTE-Rob:推进面向任务的手-目标交互视频生成,实现可通用的机器人操作 大语言模型和具身智体及自动驾驶 · 公众号 · · 4 天前 · |
|
|
GeoDrive:基于三维几何信息有精确动作控制的驾驶世界模型 大语言模型和具身智体及自动驾驶 · 公众号 · · 6 天前 · |
|
|
S4-Driver:具有时空视觉表征的可扩展自监督驾驶多模态大语言模型 大语言模型和具身智体及自动驾驶 · 公众号 · · 6 天前 · |
|
|
慢-中-快:快速操作与慢速推理统一的双-系统基础模型 大语言模型和具身智体及自动驾驶 · 公众号 · · 1 周前 · |
|
|
SwitchVLA:视觉-语言-动作模型中执行-觉察的任务切换 大语言模型和具身智体及自动驾驶 · 公众号 · · 1 周前 · |
|
|
DexMachina:双手灵巧操作的功能重定向 大语言模型和具身智体及自动驾驶 · 公众号 · · 1 周前 · |
|
|
ForceVLA:利用力-觉察 MoE 增强 VLA 模型以实现丰富接触的操作 大语言模型和具身智体及自动驾驶 · 公众号 · · 1 周前 · |
|
|
LoHoVLA:面向长范围具身任务的统一视觉-语言-动作模型 大语言模型和具身智体及自动驾驶 · 公众号 · · 1 周前 · |
|
|
SLAC:用于全身真实世界强化学习的模拟预训练潜动作空间 大语言模型和具身智体及自动驾驶 · 公众号 · · 1 周前 · |
|
|
SmolVLA:经济高效的机器人视觉-语言-动作模型 大语言模型和具身智体及自动驾驶 · 公众号 · · 1 周前 · |
|
|
OG-VLA:通过正交图像生成的 3D-觉察视觉-语言-动作模型 大语言模型和具身智体及自动驾驶 · 公众号 · · 1 周前 · |
|
|
以人类演示视频为提示,学习可泛化的机器人策略 大语言模型和具身智体及自动驾驶 · 公众号 · · 1 周前 · |
|
|
DexUMI:以人手为通用操作界面,实现灵巧操作 大语言模型和具身智体及自动驾驶 · 公众号 · · 1 周前 · |
|
|
通过基于流视频预测的可泛化双手操作基础策略 大语言模型和具身智体及自动驾驶 · 公众号 · · 1 周前 · |
|
|
Impromptu VLA:用于驾驶视觉-语言-动作模型的开放权重和开放数据 大语言模型和具身智体及自动驾驶 · 公众号 · · 1 周前 · |
|