An annotation tool for VLA (Vision-Language-Action) tasks.

These details have not been verified by PyPI

Project description

LabelVLA

面向 VLA 任务的标注工具

English

为什么需要 LabelVLA？

VLA（Vision-Language-Action）是以视觉为中心的机器人操作任务范式。与传统的图像/视频标注不同，VLA 数据具有以下特点：

多模态时序数据：同时包含多相机视频流、机械臂关节角度序列、末端执行器位姿等
以 episode 为单位：每个 episode 是一次完整的操作过程
时间维度标注：需要在时间轴上划分语义片段（segment），而非逐帧标注

目前没有一个专门面向 VLA 数据的标注工具。LabelVLA 填补了这一空白，原生支持 LeRobot v2.1 格式数据，提供以时间轴为核心的标注界面。

功能特性

LeRobot v2.1 格式原生支持 — 直接读取 parquet + mp4 数据，无需格式转换
多相机视图 — 同时显示头部相机（大画面）和左右腕部相机（侧边小画面）
关节角度曲线可视化 — 绘制所有关节角度随时间变化的曲线，支持按关节名称勾选/取消显示
时间轴 Segment 标注 — 在时间轴上划分片段，每个片段标注文本描述
目标框标注 — 在头部相机画面上画矩形框，框自动应用到同一 segment 的所有帧
运动物体追踪 — 对 segment 内位置变化的物体，通过在不同帧点击设置关键点，系统自动插值生成运动轨迹
标注结果持久化 — 以 JSON 格式保存到数据集目录下的 segments/ 文件夹

支持的数据格式

LabelVLA 支持标准的 LeRobot v2.1 目录结构：

dataset_folder/
├── meta/
│   ├── info.json            # 数据集元信息（fps、特征定义、相机列表等）
│   ├── episodes.jsonl       # 每个 episode 的帧数
│   └── tasks.jsonl          # 任务描述
├── data/
│   └── chunk-000/
│       ├── episode_000000.parquet   # 关节角度、速度、动作等时序数据
│       ├── episode_000001.parquet
│       └── ...
└── videos/
    └── chunk-000/
        ├── observation.images.head/
        │   ├── episode_000000.mp4
        │   └── ...
        ├── observation.images.left_wrist/
        │   └── ...
        └── observation.images.right_wrist/
            └── ...

安装

通过 pip 安装

pip install labelvla

# 启动
labelvla

从源码安装

git clone https://github.com/Kingdroper/labelVLA.git
cd labelVLA

# 使用 uv（推荐）
uv sync
uv run labelvla

# 或使用 pip
pip install -e .
labelvla

依赖项

Python >= 3.10
PyQt5
OpenCV (opencv-python)
pandas + pyarrow
matplotlib
其他依赖详见 pyproject.toml

快速上手

第一步：启动程序

labelvla
# 或
uv run labelvla

第二步：打开 LeRobot 数据集

在工具栏或 File 菜单中点击 LeRobot 按钮，选择数据集文件夹（包含 meta/info.json 的目录）。

第三步：浏览数据

打开后进入 LeRobot 标注窗口：

┌─────────────────────────────────────────────────┐
│ Episode: [下拉选择 ▼]                    [Save]  │
├─────────────────────────────────────────────────┤
│  关节角度曲线（支持勾选显示的关节）               │
│  点击曲线可跳转到对应帧                           │
├─────────────────────────────────────────────────┤
│  ┌──────────────────┐  ┌─────────┐              │
│  │   头部相机（大）   │  │ 左腕相机 │              │
│  │   可画标注框       │  ├─────────┤              │
│  │                    │  │ 右腕相机 │              │
│  └──────────────────┘  └─────────┘              │
├─────────────────────────────────────────────────┤
│  [seg1][    seg2    ][seg3]   时间轴             │
│  [<] ═══════════════════════════════ [>] 42/949  │
└─────────────────────────────────────────────────┘

切换帧：拖动时间轴滑块，或按键盘 ← →
切换 episode：使用顶部下拉框
关节曲线：点击 "Joints ▼" 展开关节选择面板，勾选需要显示的关节

第四步：创建 Segment

在右侧 Segments 面板：

点击 "+ Add"：手动输入起始帧、结束帧和文本描述
点击 "+ At Current"：以当前帧为起始帧快速创建

Segment 会在时间轴和关节曲线上以彩色色块显示。

第五步：标注目标框

将时间轴拖到 segment 范围内的某一帧
在头部相机大画面上鼠标左键拖拽画矩形框
在弹出框中输入类别名称
框自动应用到该 segment 的所有帧（静态物体）

第六步：追踪运动物体

对于 segment 内位置会变化的物体：

在右侧面板选中一个 segment，再选中其中的一个 bbox
点击 "Track Object" 进入追踪模式（按钮变橙色）
用时间轴切换到不同帧，在头部相机画面上点击物体中心位置
每次点击记录一个关键点（红点显示），相邻关键点之间自动线性插值
可以每帧点击，也可以隔多帧点击——系统会自动补全中间帧
按 Esc 或再次点击按钮退出追踪模式
点击 "Clear Path" 可清除运动轨迹

第七步：保存

点击 Save 按钮或按 Ctrl+S
切换 episode 或关闭窗口时自动保存

标注输出格式

标注结果保存在 {数据集目录}/segments/episode_NNNNNN.json：

{
  "episode_index": 0,
  "segments": [
    {
      "start_frame": 0,
      "end_frame": 120,
      "text": "伸手抓取骨牌",
      "bboxes": [
        {
          "x": 100.0,
          "y": 200.0,
          "width": 50.0,
          "height": 50.0,
          "label": "domino",
          "keypoints": []
        },
        {
          "x": 300.0,
          "y": 150.0,
          "width": 40.0,
          "height": 40.0,
          "label": "gripper",
          "keypoints": [
            {"frame": 0, "cx": 320.0, "cy": 170.0},
            {"frame": 60, "cx": 150.0, "cy": 220.0},
            {"frame": 120, "cx": 120.0, "cy": 210.0}
          ],
          "interpolated_centers": [
            {"frame": 0, "cx": 320.0, "cy": 170.0},
            {"frame": 1, "cx": 317.2, "cy": 170.8},
            {"frame": 2, "cx": 314.3, "cy": 171.7},
            "... (每一帧一个条目，共 121 条)",
            {"frame": 120, "cx": 120.0, "cy": 210.0}
          ]
        }
      ]
    }
  ]
}

字段说明：

字段	说明
`start_frame` / `end_frame`	segment 的起止帧号
`text`	segment 的文本描述
`bboxes[].x/y/width/height`	矩形框的原始位置和大小
`bboxes[].label`	目标类别
`bboxes[].keypoints`	运动关键点列表（空 = 静态物体）
`keypoints[].frame`	关键帧帧号
`keypoints[].cx/cy`	该帧框中心坐标
`bboxes[].interpolated_centers`	插值后每帧的框中心坐标（仅运动物体，可直接读取无需重新计算）

快捷键

快捷键	功能
`←` / `→`	前一帧 / 后一帧
`Ctrl+S`	保存标注
`Ctrl+W`	关闭窗口
`Esc`	退出追踪模式

致谢

LabelVLA 基于 labelme 构建，感谢 labelme 项目提供的基础框架。

Project details

These details have not been verified by PyPI

Release history Release notifications | RSS feed

0.2.1

Apr 25, 2026

0.2.0

Apr 25, 2026

0.1.1

Apr 19, 2026

This version

0.1.0

Apr 18, 2026

Download files

Download the file for your platform. If you're not sure which to choose, learn more about installing packages.

Source Distribution

labelvla-0.1.0.tar.gz (11.8 MB view details)

Uploaded Apr 18, 2026 Source

Built Distribution

If you're not sure about the file name format, learn more about wheel file names.

The dropdown lists show the available interpreters, ABIs, and platforms. Enable javascript to be able to filter the list of wheel files.

labelvla-0.1.0-py3-none-any.whl (594.2 kB view details)

Uploaded Apr 18, 2026 Python 3

File details

Details for the file labelvla-0.1.0.tar.gz.

File metadata

Download URL: labelvla-0.1.0.tar.gz
Upload date: Apr 18, 2026
Size: 11.8 MB
Tags: Source
Uploaded using Trusted Publishing? No
Uploaded via: twine/6.2.0 CPython/3.13.5

File hashes

Hashes for labelvla-0.1.0.tar.gz
Algorithm	Hash digest
SHA256	`ae03dd3c2ec8cdf538606ee6b17f25bf8c99abfdc87756bcb47c8efddc28ff75`
MD5	`8d6ea8dd1bbccc9b1784f4f18138fef8`
BLAKE2b-256	`bb00d86c1f532f9b0090ed6d657f6a0791b9ca80d86c51a0f84c4011c19fdeb1`

See more details on using hashes here.

File details

Details for the file labelvla-0.1.0-py3-none-any.whl.

File metadata

Download URL: labelvla-0.1.0-py3-none-any.whl
Upload date: Apr 18, 2026
Size: 594.2 kB
Tags: Python 3
Uploaded using Trusted Publishing? No
Uploaded via: twine/6.2.0 CPython/3.13.5

File hashes

Hashes for labelvla-0.1.0-py3-none-any.whl
Algorithm	Hash digest
SHA256	`616d5fb77be5fb6d7de21e410c25ff49798052def015840eb0c15a9b459cbc3e`
MD5	`9a3ae26d56930cd4c7d1d685dc10ba17`
BLAKE2b-256	`bbca116b7ca56cc67b98137d3416398d20d9bc49dc99f462f4895778e9619968`

See more details on using hashes here.

labelvla 0.1.0

Navigation

Verified details

Maintainers

Unverified details

Meta

Classifiers

Project description

LabelVLA

为什么需要 LabelVLA？

功能特性

支持的数据格式

安装

通过 pip 安装

从源码安装

依赖项

快速上手

第一步：启动程序

第二步：打开 LeRobot 数据集

第三步：浏览数据

第四步：创建 Segment

第五步：标注目标框

第六步：追踪运动物体

第七步：保存

标注输出格式

快捷键

致谢

Project details

Verified details

Maintainers

Unverified details

Meta

Classifiers

Release history Release notifications | RSS feed

Download files

Source Distribution

Built Distribution

File details

File metadata

File hashes

File details

File metadata

File hashes