Skip to main content

Toggle Huggingface Hub and Cloud.ru Repo

Project description

Switch-Hub
switch-hub — это удобная утилита для переключения между разными источниками моделей и датасетов: Hugging Face Hub, Cloud.ru Repo. Она позволяет прозрачно работать с моделями и датасетами в разных экосистемах, не изменяя привычный интерфейс.

Основные возможности

  • Лёгкое переключение между хранилищами: Hugging Face Hub, Cloud.ru Repo.
  • Минимальные изменения в коде — привычный интерфейс transformers, datasets, diffusers ....
  • Гибкость для CI/CD, исследований и продакшена.

Установка

pip install switch-hub

Пример использования

from transformers import AutoModel
from switch_hub import HubSwitcher

switcher = HubSwitcher()

# Переключаемся на Hugging Face Hub
switcher.switch_to_hf()
model = AutoModel.from_pretrained('dmitryradionov/some-model')

# Переключаемся на Repo Cloud.ru и пушим модель туда
switcher.switch_to_rh()
model.push_to_hub('70e5f7a7-f6a7-4fd7-a8ea-e288150b6fb8/some-model')

# Загружаем модель из Cloud.ru Repo 
model_mr = AutoModel.from_pretrained('70e5f7a7-f6a7-4fd7-a8ea-e288150b6fb8/some-model')

# Снова переключаемся на Hugging Face Hub и пушим модель назад
switcher.switch_to_hf()
model_mr.push_to_hub("dmitryradionov/some-model")

Работа с аутентификацией и токенами

Для работы с приватными и большинством публичных репозиториев, потребуется токен доступа:

  • Hugging Face Hub: HF_TOKEN
  • Cloud.ru Repo: RH_TOKEN (обязателен всегда)

Как передавать токены

1. Через переменные окружения или .env файл
Рекомендуется для локальной разработки и CI/CD:
Пример .env:

HF_TOKEN=hf_xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
RH_TOKEN=rh_yyyyyyyyyyyyyyyyyyyyyyyyyyyyyyyyyyyyy

2. Явно в конструктор HubSwitcher

from switch_hub import HubSwitcher

switcher = HubSwitcher(
    hf_token="hf_xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx",
    rh_token="rh_yyyyyyyyyyyyyyyyyyyyyyyyyyyyyyyyyyyyy"
)

Важно:

  • RH_TOKEN обязателен для Cloud.ru Repo всегда
  • HF_TOKEN обязателен только для приватных репозиториев Hugging Face, но рекомендуется указывать всегда, чтобы избежать лимитов и быть готовым к работе с приватным контентом Hugging Face
  • Никогда не публикуйте свои токены в открытых источниках — используйте секреты сборки и переменные окружения

Описание ключевых методов

reset()
Восстанавливает все переменные окружения и внутренние настройки, которые были изменены при переключении между хабами. Используйте этот метод, если нужно вручную откатить все изменения состояния, внесённые switcher'ом, например после завершения операций с приватным registry.

Пример:

switcher.switch_to_rh()
# ... работа с приватным хабом ...
switcher.reset()  # Возвращение к исходным параметрам окружения

context(mode)
Контекстный менеджер для временного переключения хаба.
После выхода из блока with окружение автоматически восстанавливается к исходному.

Пример:

from switch_hub import HubSwitcher

switcher = HubSwitcher()

with switcher.context('rh'):
    # В этом блоке все операции проходят через Cloud.ru Repo
    model = AutoModel.from_pretrained('cloudru_id/some-model')
    # ... другие операции ...

# После выхода из блока — автоматически восстановлен Hugging Face/прежний хаб
# mode: может быть 'hf' (Hugging Face Hub) или 'rh' (Cloud.ru Repo)

Кейсы использования

  • Исследование новых моделей: переключайтесь между публичными репозиториями и приватным registry.
  • Экспорт и импорт моделей между облаком и Hugging Face.
  • Автоматизация CI/CD пайплайнов для MLOps.

P.S. Эти способы аутентификации работают для моделей, датасетов, diffusers и других библиотек, поддерживаемых switch-hub.
Рекомендуется всегда указывать RH_TOKEN и HF_TOKEN через переменные окружения или секреты инфраструктуры для максимальной гибкости и безопасности.

Project details


Download files

Download the file for your platform. If you're not sure which to choose, learn more about installing packages.

Source Distribution

switch_hub-0.0.4.tar.gz (10.0 kB view details)

Uploaded Source

Built Distribution

If you're not sure about the file name format, learn more about wheel file names.

switch_hub-0.0.4-py3-none-any.whl (8.8 kB view details)

Uploaded Python 3

File details

Details for the file switch_hub-0.0.4.tar.gz.

File metadata

  • Download URL: switch_hub-0.0.4.tar.gz
  • Upload date:
  • Size: 10.0 kB
  • Tags: Source
  • Uploaded using Trusted Publishing? Yes
  • Uploaded via: twine/6.1.0 CPython/3.12.9

File hashes

Hashes for switch_hub-0.0.4.tar.gz
Algorithm Hash digest
SHA256 a8377ba3293a1f35546f51def49e399d6b4d2f305cc3de9b9e64f804f3bed8e3
MD5 840d0ba8371ff43186c4bc98d7ca9bca
BLAKE2b-256 03260422dd4892ca50f8a90d99f009dd9e0fd226dc8ae7fc850839eddb9debf0

See more details on using hashes here.

Provenance

The following attestation bundles were made for switch_hub-0.0.4.tar.gz:

Publisher: python-publish.yml on Gravi7ON/switch-hub

Attestations: Values shown here reflect the state when the release was signed and may no longer be current.

File details

Details for the file switch_hub-0.0.4-py3-none-any.whl.

File metadata

  • Download URL: switch_hub-0.0.4-py3-none-any.whl
  • Upload date:
  • Size: 8.8 kB
  • Tags: Python 3
  • Uploaded using Trusted Publishing? Yes
  • Uploaded via: twine/6.1.0 CPython/3.12.9

File hashes

Hashes for switch_hub-0.0.4-py3-none-any.whl
Algorithm Hash digest
SHA256 5b323a4116c55f202cc3467a3a03abe92fce9465496c4266a168ec07d6e15875
MD5 3d06894cd58a4349783ea9170f733f95
BLAKE2b-256 3c6de45167bf857e6de5eb6209aa40b4e687831e224bfddc58c4e68dc1c58445

See more details on using hashes here.

Provenance

The following attestation bundles were made for switch_hub-0.0.4-py3-none-any.whl:

Publisher: python-publish.yml on Gravi7ON/switch-hub

Attestations: Values shown here reflect the state when the release was signed and may no longer be current.

Supported by

AWS Cloud computing and Security Sponsor Datadog Monitoring Depot Continuous Integration Fastly CDN Google Download Analytics Pingdom Monitoring Sentry Error logging StatusPage Status page