专栏名称: 大语言模型和具身智体及自动驾驶
讨论计算机视觉、深度学习和自动驾驶的技术发展和挑战
目录
相关文章推荐
仪征众声  ·  仪征医院志愿者招募通知 ·  昨天  
BRTV建外14号  ·  北医三院海淀北部院区今日开诊! ·  昨天  
中国中医科学院望京医院  ·  【望京︱动态】"微笑服务 天使在身边" ... ·  2 天前  
中国中医科学院望京医院  ·  【望京︱动态】"微笑服务 天使在身边" ... ·  2 天前  
51好读  ›  专栏  ›  大语言模型和具身智体及自动驾驶

LeRobot的数据集系统(下)

大语言模型和具身智体及自动驾驶  · 公众号  ·  · 2025-05-23 00:08

正文

请到「今天看啥」查看全文


要从 Hugging Face Hub 加载现有数据集,请执行以下操作:

# Load the entire dataset

dataset = LeRobotDataset("lerobot/aloha_mobile_cabinet")

# Load a subset of episodes

dataset = LeRobotDataset("lerobot/aloha_mobile_cabinet", episodes=[0, 10, 20])

# View metadata only (without downloading data)

metadata = LeRobotDatasetMetadata("lerobot/aloha_mobile_cabinet")

创建新数据集

可以使用 LeRobotDatasetMetadata 的 create 类方法创建新数据集:

# Create a new dataset metadata

metadata = LeRobotDatasetMetadata.create(

repo_id="username/new_dataset",

fps=30,

robot=robot_instance, # Or provide features directly

use_videos=True

)

# Create a dataset instance

dataset = LeRobotDataset("username/new_dataset")

# Create an episode buffer for adding frames

episode_buffer = dataset.create_episode_buffer()

数据访问和处理流程

下图展示 LeRobotDataset 如何访问和处理数据:


高级功能

历史和未来数据的 delta 时间戳

LeRobotDataset 最强大的功能之一是能够使用 delta 时间戳加载具有指定时间偏移的帧序列:


初始化数据集时,可以指定 delta 时间戳来加载每种模态的帧序列:

delta_timestamps = {

"observation.images.front": [-1.0, -0.5, -0.2, 0], # 1s before, 0.5s before, 0.2s before, current

"observation.state": [-1.5, -1.0, -0.5, -0.2, -0.1, 0], # Historical states







请到「今天看啥」查看全文