HuggingFace Space Worker 分布式调度系统
Project description
HFS v2 - HuggingFace Space Worker 分布式调度系统
基于 Redis 的分布式 Worker 调度系统,用于管理 HuggingFace Space 资源池。
特性
- ✅ 分布式调度 - 多 Worker 并发,自动负载均衡
- ✅ 状态管理 - 原子操作(Lua 脚本),保证一致性
- ✅ 健康检查 - 自动检测崩溃、超时、孤儿资源
- ✅ 账号管理 - 多账号池,自动选择、cooldown、评分
- ✅ Space 轮换 - 自动创建、绑定、轮换、复用
- ✅ 场景配置 - 内置多种场景,支持自定义
- ✅ Admin CLI - 命令行管理工具
快速开始
1. 安装
pip install mp-hfs
2. 配置环境(可选)
CLI 已内置默认 Redis URL,可直接使用。如需自定义:
export HFS_REDIS_URL="redis://:password@host:port/db"
3. 初始化账号池
# 添加账号
hfs-admin account create "hf_xxxxx" --max-spaces=6
# 查看账号
hfs-admin account list
参考 使用指南
4. 创建项目
创建 my-project.yaml:
project:
id: "my-project"
scene: "production"
required_nodes: 3
start_script:
type: inline
inline: "python -m my_app"
nodes:
ids: ["node-1", "node-2", "node-3"]
# 或不指定,自动生成:my-project-1, my-project-2, my-project-3
初始化:
hfs-admin project init my-project.yaml
hfs-admin project bootstrap my-project
5. 监控
# 查看节点状态
hfs-admin node list --project my-project
# 查看 Space 状态
hfs-admin space list --project my-project
# 健康检查
hfs-admin health check
场景配置
| 场景 | 运行超时 | 部署间隔 | 适用场景 |
|---|---|---|---|
dev_test |
5分钟 | 30秒 | 开发测试 |
short_task |
30分钟 | 3分钟 | 短任务 |
long_task |
1小时 | 5分钟 | 长任务 |
production |
6-10小时随机 | 10分钟 | 生产环境(默认) |
详见 场景配置文档
文档
用户文档
设计文档
开发文档
测试文档
架构
┌─────────────┐
│ Redis │ ← 状态存储
└──────┬──────┘
│
┌───┴────┐
│ │
┌──▼──┐ ┌─▼───┐
│Worker│ │Worker│ ← 独立进程
└──┬──┘ └─┬───┘
│ │
┌──▼───────▼──┐
│ Scheduler │ ← 调度器
└─────────────┘
核心模块
- state.py - 状态机 + 原子操作(Lua 脚本)
- health.py - 健康检查(崩溃检测、一致性验证)
- policy.py - 策略配置(场景、命名)
- worker.py - Worker 主循环(心跳、进程管理)
- scheduler.py - 调度器(分配、轮换、创建)
- account.py - 账号管理(选择、cooldown、评分)
- hf.py - HuggingFace API 封装
开发
本地开发
git clone <repo>
cd v2
pip install -e .
pytest tests/ -v
测试
# 运行所有测试
pytest tests/ -v
# 运行特定模块
pytest tests/test_state.py -v
pytest tests/test_worker.py -v
pytest tests/test_scheduler.py -v
许可
MIT License
Project details
Release history Release notifications | RSS feed
Download files
Download the file for your platform. If you're not sure which to choose, learn more about installing packages.
Source Distribution
mp_hfs-0.1.12.tar.gz
(43.9 kB
view details)
Built Distribution
Filter files by name, interpreter, ABI, and platform.
If you're not sure about the file name format, learn more about wheel file names.
Copy a direct link to the current filters
mp_hfs-0.1.12-py3-none-any.whl
(52.7 kB
view details)
File details
Details for the file mp_hfs-0.1.12.tar.gz.
File metadata
- Download URL: mp_hfs-0.1.12.tar.gz
- Upload date:
- Size: 43.9 kB
- Tags: Source
- Uploaded using Trusted Publishing? No
- Uploaded via: twine/6.2.0 CPython/3.12.11
File hashes
| Algorithm | Hash digest | |
|---|---|---|
| SHA256 |
14fa3d7bf26cd35d027fb80b3d2260ced4315f0d90a08acec6f08b094c2c6362
|
|
| MD5 |
a7a4034211364b469814aa67051dbef9
|
|
| BLAKE2b-256 |
8655ae07135713f170d474a0db50bd323bea56a6ab9e70a4e3c834e13378d215
|
File details
Details for the file mp_hfs-0.1.12-py3-none-any.whl.
File metadata
- Download URL: mp_hfs-0.1.12-py3-none-any.whl
- Upload date:
- Size: 52.7 kB
- Tags: Python 3
- Uploaded using Trusted Publishing? No
- Uploaded via: twine/6.2.0 CPython/3.12.11
File hashes
| Algorithm | Hash digest | |
|---|---|---|
| SHA256 |
36c96fd6a90f4cae46884efb0eccd97d9a73596c94391aa73ec9fb4c25cc6ae6
|
|
| MD5 |
bdfbc6cb4ad922baaac02f0a0450a644
|
|
| BLAKE2b-256 |
9690849948f201494617f35906838e3a3df7a04938e2fbd413c133eccaafb674
|