Manage GPU sessions on Clouditia platform

These details have not been verified by PyPI

Project links

Project description

Clouditia Manager SDK

SDK Python pour gérer les sessions GPU sur la plateforme Clouditia via l'API Computing (sk_compute_).

Installation

pip install clouditia-manager

Quick Start

from clouditia_manager import GPUManager

# Initialiser avec votre clé API sk_compute_
manager = GPUManager(api_key="sk_compute_xxxxx")

# Créer une session GPU
# Le SDK attend automatiquement que la session soit prête
session = manager.create_session(
    gpu_type="nvidia-rtx-3090",
    vcpu=2,
    ram=4,
    storage=20
)

# Output:
# Creating GPU session with nvidia-rtx-3090...
# Session created: 0e4c713a
# Waiting for session 0e4c713a to be ready... Ready!
#
# ==================================================
#   SESSION READY
# ==================================================
#   Name     : compute-gpu-0e4c713a
#   Short ID : 0e4c713a
#   Status   : running
#   GPU      : nvidia-rtx-3090 x1
#   vCPU     : 2
#   RAM      : 4Gi
#   Storage  : 20Gi
#   URL      : https://clouditia.com/code-editor/...
#   Password : xxxxxxxxxxxx
# ==================================================

print(f"Session prête: {session.name}")

Configuration

from clouditia_manager import GPUManager

# Configuration par défaut (URL: https://clouditia.com/jobs)
manager = GPUManager(api_key="sk_compute_xxxxx")

# Configuration avec timeout personnalisé
manager = GPUManager(
    api_key="sk_compute_xxxxx",
    base_url="https://clouditia.com/jobs",
    timeout=120  # Timeout en secondes (défaut: 60)
)

Fonctionnalités

1. Vérifier la clé API

La vérification est automatique à l'initialisation :

manager = GPUManager(api_key="sk_compute_xxxxx")
print(f"Utilisateur: {manager.user['username']}")
print(f"Email: {manager.user['email']}")

2. Créer une session GPU (Single GPU)

# Création standard (attend automatiquement que la session soit prête)
session = manager.create_session(
    gpu_type="nvidia-rtx-3090",  # Type de GPU
    gpu_count=1,                  # Nombre de GPUs
    vcpu=4,                       # Nombre de vCPUs
    ram=16,                       # RAM en GB
    storage=20                    # Stockage en GB
)

# Création sur un cluster spécifique (voir section "Clusters")
session = manager.create_session(
    gpu_type="nvidia-rtx-3090",
    vcpu=4,
    ram=16,
    storage=20,
    cluster_id="a1b2c3d4-xxxx-xxxx-xxxx-xxxxxxxxxxxx"
)

# Création avec environnement Docker personnalisé
session = manager.create_session(
    gpu_type="nvidia-rtx-3090",
    environment_id="3a07d1e9-xxxx-xxxx-xxxx-xxxxxxxxxxxx",
    vcpu=8,
    ram=32
)

# La session est prête avec un nom automatique: compute-gpu-{short_id}
print(f"Nom: {session.name}")        # compute-gpu-0e4c713a
print(f"ID: {session.short_id}")     # 0e4c713a
print(f"Status: {session.status}")   # running
print(f"URL: {session.url}")
print(f"Password: {session.password}")

# Options avancées
session = manager.create_session(
    gpu_type="nvidia-rtx-3090",
    wait_ready=True,     # Attendre que la session soit prête (défaut: True)
    timeout=180,         # Timeout en secondes (défaut: 180)
    verbose=True         # Afficher les messages de status (défaut: True)
)

# Mode silencieux (sans attente ni messages)
session = manager.create_session(
    gpu_type="nvidia-rtx-3090",
    wait_ready=False,    # Ne pas attendre
    verbose=False        # Pas de messages
)

Sessions reprises depuis un custom env (workspace restore)

Quand vous reprenez une session sauvegardée comme environnement personnalisé (venv), le pod GPU doit re-télécharger le workspace (code, modèles, caches) depuis S3 avant que VS Code / Jupyter soit utilisable. Pour un gros workspace (vLLM,

10 GB), cela peut prendre plusieurs minutes.

Le SDK expose cet état via trois champs sur GPUSession :

session.ready → True uniquement quand la session est complètement utilisable (pas juste status == "running").
session.estimated_ready_in_seconds → ETA en secondes.
session.workspace_sync → dict live : {in_progress, bytes_done, bytes_total, files_done, pct, rate_bps, eta_seconds}.

Avec wait_ready=True (défaut), create_session() bloque jusqu'à ready=True et affiche une barre de progression du restore workspace :

Workspace restore [████████░░░░░░░░░░░░░░░░░░░░░░]  28.4%  3.12/10.98 GB  ETA 124s

Si vous préférez ne pas bloquer :

session = manager.create_session(..., wait_ready=False)

# Plus tard, poller manuellement
while True:
    s = manager.get_session(session.short_id)
    if s.ready:
        break
    if s.workspace_sync and s.workspace_sync.get("in_progress"):
        ws = s.workspace_sync
        print(f"Workspace {ws['pct']:.0f}%  ETA {ws.get('eta_seconds', '?')}s")
    time.sleep(5)

3. Créer une session Multi-GPU (plusieurs types de GPU)

# Créer une session avec plusieurs GPUs de types différents
session = manager.create_session(
    gpus=[
        {'type': 'nvidia-rtx-3090', 'count': 1},
        {'type': 'nvidia-rtx-3060-ti', 'count': 1}
    ],
    vcpu=4,
    ram=16,
    storage=20
)

# Output:
# Creating GPU session with 1x nvidia-rtx-3090, 1x nvidia-rtx-3060-ti...
# Session created: f0b09214
# Waiting for session f0b09214 to be ready... Ready!
#
# ==================================================
#   SESSION READY
# ==================================================
#   Name     : compute-gpu-f0b09214
#   Short ID : f0b09214
#   Status   : running
#   GPUs     : 2 total
#            - nvidia-rtx-3090 x1
#            - nvidia-rtx-3060-ti x1
#   vCPU     : 4
#   RAM      : 16Gi
#   Storage  : 20Gi
#   URL      : https://clouditia.com/code-editor/...
#   Password : xxxxxxxxxxxx
# ==================================================

print(f"GPU Count: {session.gpu_count}")  # 2
print(f"GPUs: {session.gpus}")            # Liste des configs GPU

4. Gestion de la disponibilité GPU (allow_partial)

Le SDK vérifie automatiquement la disponibilité des GPUs demandés avant de créer la session.

# Si certains GPUs ne sont pas disponibles, le SDK affiche:
# ==================================================
#   GPU AVAILABILITY CHECK
# ==================================================
#   Unavailable GPUs:
#     - nvidia-rtx-4090
#   Available GPUs:
#     - nvidia-rtx-3090
# ==================================================
# Continue with 1 available GPU(s)? [y/N]:

# Mode interactif (par défaut): demande confirmation
session = manager.create_session(
    gpus=[
        {'type': 'nvidia-rtx-3090', 'count': 1},
        {'type': 'nvidia-rtx-4090', 'count': 1}
    ],
    vcpu=4,
    ram=16,
    storage=20
)

# Mode automatique: continue avec les GPUs disponibles
session = manager.create_session(
    gpus=[
        {'type': 'nvidia-rtx-3090', 'count': 1},
        {'type': 'nvidia-rtx-4090', 'count': 1}
    ],
    vcpu=4,
    ram=16,
    storage=20,
    allow_partial=True  # Continue avec les GPUs disponibles uniquement
)

5. Lister les sessions

# Toutes les sessions
sessions = manager.list_sessions()

# Filtrer par status
running = manager.list_sessions(status="running")
stopped = manager.list_sessions(status="stopped")

for session in sessions:
    print(f"{session.name} ({session.short_id}): {session.status} - {session.gpu_type}")

5. Obtenir le status d'une session

# Par short ID (8 caractères)
session = manager.get_session("0e4c713a")

print(f"Nom: {session.name}")        # compute-gpu-0e4c713a
print(f"Status: {session.status}")   # running
print(f"GPU: {session.gpu_type}")    # nvidia-rtx-3090
print(f"GPUs: {session.gpus}")       # Liste des GPUs (pour multi-GPU)
print(f"URL: {session.url}")

6. Renommer une session

# Chaque session a un nom par défaut: compute-gpu-{short_id}
session = manager.create_session(gpu_type="nvidia-rtx-3090")
print(f"Nom par défaut: {session.name}")  # compute-gpu-0e4c713a

# Renommer la session
session = manager.rename_session("0e4c713a", "mon-projet-ml-v1")
print(f"Nouveau nom: {session.name}")  # mon-projet-ml-v1

7. Arrêter une session

# Arrêt standard (attend automatiquement la suppression du pod)
session = manager.stop_session("0e4c713a")

# Output:
# Stopping session 0e4c713a...
# Waiting for pod termination... Done!
#
# ==================================================
#   SESSION STOPPED
# ==================================================
#   Name     : mon-projet-ml-v1
#   Short ID : 0e4c713a
#   Status   : stopped
#   GPU      : nvidia-rtx-3090 (released)
# ==================================================

print(f"Session arrêtée: {session.name}")
print(f"Status: {session.status}")

# Options avancées
session = manager.stop_session(
    "0e4c713a",
    wait_stopped=True,   # Attendre la suppression complète (défaut: True)
    timeout=120,         # Timeout en secondes (défaut: 120)
    verbose=True         # Afficher les messages (défaut: True)
)

# Mode silencieux
session = manager.stop_session("0e4c713a", wait_stopped=False, verbose=False)

8. Consulter les GPUs disponibles

inventory = manager.get_inventory()

if not inventory:
    print("Aucun GPU disponible actuellement")
else:
    for gpu in inventory:
        print(f"{gpu.gpu_name}: {gpu.available} disponible(s)")
        print(f"  Prix: {gpu.price_per_hour}EUR/h")

# Filtrer par cluster (UUID string)
inventory = manager.get_inventory(cluster_id="a1b2c3d4-xxxx-xxxx-xxxx-xxxxxxxxxxxx")
for gpu in inventory:
    print(f"{gpu.gpu_name}: {gpu.available} disponible(s)")

8b. Lister les clusters disponibles

Si votre organisation dispose de plusieurs clusters Kubernetes, vous pouvez les lister et cibler un cluster spécifique pour créer des sessions ou consulter l'inventaire GPU.

from clouditia_manager import GPUManager

manager = GPUManager(api_key="sk_compute_xxxxx")

# Lister tous les clusters
clusters = manager.list_clusters()

for cluster in clusters:
    print(f"{cluster.name} (id={cluster.cluster_id})")
    print(f"  Primary: {cluster.is_primary}")
    print(f"  GPUs: {cluster.gpu_count}")

# Exemple de sortie :
# cluster-eu-west (id=a1b2c3d4-...)
#   Primary: True
#   GPUs: 12
# cluster-us-east (id=e5f6g7h8-...)
#   Primary: False
#   GPUs: 8

# Utiliser un cluster spécifique pour créer une session
cluster = clusters[1]  # cluster-us-east
session = manager.create_session(
    gpu_type="nvidia-rtx-3090",
    vcpu=4,
    ram=16,
    cluster_id=cluster.cluster_id
)

# Consulter l'inventaire d'un cluster spécifique
inventory = manager.get_inventory(cluster_id=cluster.cluster_id)

9. Générer une clé SDK (sk_live_)

# Générer une clé pour utiliser le SDK clouditia
sdk_key = manager.generate_sdk_key("0e4c713a", name="Ma clé SDK")
print(f"Clé SDK: {sdk_key}")  # sk_live_xxxxx...

# Utiliser avec le SDK clouditia
from clouditia import GPUSession
gpu = GPUSession(api_key=sdk_key)
result = gpu.run("print('Hello GPU!')")

10. Consulter le solde de crédits

# Obtenir le solde de crédits disponible
balance = manager.get_balance()
print(f"Solde: {balance['balance']} {balance['currency']}")
# Output: Solde: 150.50 EUR

11. Coût et durée d'une session

# Obtenir le coût et la durée d'une session spécifique
cost_info = manager.get_session_cost("0e4c713a")

print(f"Session: {cost_info['name']}")
print(f"Coût actuel: {cost_info['cost']} EUR")
print(f"Taux horaire: {cost_info['hourly_rate']} EUR/h")
print(f"Durée: {cost_info['duration_display']}")
# Output:
# Session: compute-gpu-0e4c713a
# Coût actuel: 2.45 EUR
# Taux horaire: 0.98 EUR/h
# Durée: 2h 30m 15s

# Obtenir uniquement la durée
duration = manager.get_session_duration("0e4c713a")
print(f"Durée: {duration['duration_display']}")
print(f"En heures: {duration['duration_hours']}")

12. Coût de plusieurs sessions

# Obtenir le coût de plusieurs sessions spécifiques
costs = manager.get_sessions_cost(["0e4c713a", "f0b09214"])

print(f"Nombre de sessions: {costs['session_count']}")
print(f"Coût total: {costs['total_cost']} EUR")
print(f"Durée totale: {costs['total_duration_display']}")

for session in costs['sessions']:
    print(f"  - {session['name']}: {session['cost']} EUR ({session['duration_display']})")

13. Coût de toutes les sessions actives

# Obtenir le coût de toutes les sessions en cours d'exécution
active_costs = manager.get_active_sessions_cost()

print(f"Sessions actives: {active_costs['session_count']}")
print(f"Coût total: {active_costs['total_cost']} EUR")
print(f"Durée totale: {active_costs['total_duration_display']}")

if active_costs['session_count'] == 0:
    print("Aucune session active")
else:
    for session in active_costs['sessions']:
        print(f"  - {session['name']}: {session['cost']} EUR")

14. File d'attente (Queue) pour création de session

Si les GPUs ne sont pas disponibles, vous pouvez ajouter votre demande à une file d'attente au lieu de recevoir une erreur.

# Créer une session avec fallback sur la queue si indisponible
result = manager.create_session(
    gpu_type="nvidia-rtx-4090",
    vcpu=4,
    ram=16,
    storage=20,
    queue_if_unavailable=True  # Ajouter à la queue si indisponible
)

# Si la session est créée immédiatement
if isinstance(result, GPUSession):
    print(f"Session créée: {result.name}")
# Si ajouté à la queue
elif isinstance(result, dict) and result.get('queued'):
    print(f"Demande ajoutée à la queue!")
    print(f"Queue ID: {result['queue_id']}")
    print(f"Position: #{result['position']}")

# Output si mis en queue:
# ==================================================
#   REQUEST QUEUED
# ==================================================
#   Queue ID  : a1b2c3d4...
#   Position  : #3
#   Message   : Aucun GPU disponible. Votre demande a été ajoutée à la queue.
#   Unavailable GPUs: nvidia-rtx-4090
# ==================================================
#
# Use manager.get_queue_job('a1b2c3d4') to check status
# Use manager.cancel_queue_job('a1b2c3d4') to cancel

15. Lister les jobs en queue

# Lister tous vos jobs en queue
queue_jobs = manager.list_queue_jobs()

for job in queue_jobs:
    print(f"Position #{job.position}: {job.status_display}")
    print(f"  GPU Config: {job.gpu_config}")
    print(f"  Tentatives: {job.attempt_count}")
    if job.last_attempt_at:
        print(f"  Dernière tentative: {job.last_attempt_at}")

# Filtrer par status
pending_jobs = manager.list_queue_jobs(status="pending")
completed_jobs = manager.list_queue_jobs(status="completed")

16. Voir les détails d'un job en queue

# Obtenir les détails d'un job avec l'historique des tentatives
result = manager.get_queue_job("a1b2c3d4", verbose=True)

job = result['job']
attempts = result['attempts']

print(f"Position: #{job.position}")
print(f"Status: {job.status_display}")
print(f"Tentatives: {job.attempt_count}")

# Afficher l'historique des tentatives
for attempt in attempts:
    status = "Succès" if attempt.success else "Échec"
    print(f"  [{status}] {attempt.attempted_at}")
    if attempt.error_message:
        print(f"    Erreur: {attempt.error_message}")
    if attempt.unavailable_gpus:
        print(f"    GPUs indisponibles: {', '.join(attempt.unavailable_gpus)}")

17. Annuler un job en queue

# Annuler un job en attente
manager.cancel_queue_job("a1b2c3d4")
# Output: Queue job a1b2c3d4... cancelled successfully

18. Lambda GPU (Exécution Serverless)

Exécutez du code Python directement sur un GPU distant. Le code est envoyé, exécuté sur un GPU disponible, et les résultats sont récupérés automatiquement. Si aucun GPU n'est disponible, la requête est placée en file d'attente.

from clouditia_manager import GPUManager

manager = GPUManager("sk_compute_xxx")

# Exécution Lambda simple
result = manager.lambda_gpu(
    script="import torch; print(f'CUDA: {torch.cuda.is_available()}')",
    gpu_type="nvidia-rtx-3060-ti",
    vcpu=2,
    ram=4,
    storage=20
)
print(f"Exit code: {result.exit_code}")
print(f"Output: {result.stdout}")
print(f"Cost: {result.cost} EUR")

# Lambda avec un script multi-lignes
result = manager.lambda_gpu(
    script="""
import torch
import time

print("=" * 50)
print("  CLOUDITIA LAMBDA GPU")
print("=" * 50)

print(f"CUDA available: {torch.cuda.is_available()}")
if torch.cuda.is_available():
    print(f"GPU: {torch.cuda.get_device_name(0)}")
    mem = torch.cuda.get_device_properties(0).total_memory
    print(f"Memory: {mem // 1024**2} MB")

    print("\\nRunning matrix multiplication on GPU...")
    start = time.time()
    a = torch.randn(5000, 5000, device='cuda')
    b = torch.randn(5000, 5000, device='cuda')
    c = torch.matmul(a, b)
    torch.cuda.synchronize()
    duration = time.time() - start
    print(f"5000x5000 matmul: {duration:.3f}s")
    print(f"Result shape: {c.shape}")
    print(f"GPU memory used: {torch.cuda.memory_allocated() // 1024**2} MB")
else:
    print("No GPU found!")

print("\\nTest completed!")
""",
    gpu_type="nvidia-rtx-3060-ti",
    vcpu=2,
    ram=4,
    storage=20
)
print(result.stdout)

# Lambda avec un environnement Docker personnalisé
# (l'ID de l'environnement est visible sur /gpu/session-config/)
result = manager.lambda_gpu(
    script="import torch; print(torch.cuda.is_available())",
    gpu_type="nvidia-rtx-3090",
    environment_id="3a07d1e9-xxxx-xxxx-xxxx-xxxxxxxxxxxx",
    vcpu=8,
    ram=32,
    storage=100
)

Tarification Lambda : Le coût inclut un tarif horaire GPU (majoré par un coefficient configurable) et des frais fixes par exécution. Le coût est toujours arrondi au centime supérieur (0.01 EUR minimum).

18b. run_and_stop() (Exécution avec session complète)

Crée une session GPU complète, exécute un script, upload les résultats vers S3, puis arrête la session automatiquement. Utile quand vous avez besoin d'uploader/downloader des fichiers locaux ou d'interagir avec le filesystem du pod.

result = manager.run_and_stop(
    script="python train.py --epochs 10",
    gpu_type="nvidia-rtx-3090",
    input_files=["train.py", "data.csv"],
    output_files=["model.pt", "logs/"],
    s3_bucket="my-bucket",
    s3_prefix="training-results/run-001/"
)

print(f"Success: {result.success}")
print(f"Exit code: {result.exit_code}")
print(f"Output: {result.stdout}")
print(f"Duration: {result.duration_seconds}s")
print(f"Cost: {result.cost} EUR")

19. Connexion S3 pour Lambda GPU

Configurez une connexion S3 pour sauvegarder les outputs de vos Lambda GPU.

# Créer une connexion S3
s3 = manager.s3_connect(
    bucket="mon-bucket",
    access_key="AWS_ACCESS_KEY_ID",
    secret_key="AWS_SECRET_ACCESS_KEY",
    endpoint="https://s3.amazonaws.com",  # Optionnel (défaut: AWS S3)
    region="us-east-1",                    # Optionnel (défaut: us-east-1)
    prefix="lambda-outputs/"               # Optionnel: préfixe pour les fichiers
)

# La connexion S3 peut aussi être utilisée avec des services compatibles S3
# MinIO, Wasabi, DigitalOcean Spaces, etc.
s3_minio = manager.s3_connect(
    bucket="my-bucket",
    access_key="minio-access-key",
    secret_key="minio-secret-key",
    endpoint="https://minio.example.com"
)

20. Sauvegarder des outputs vers S3

Depuis votre script Lambda GPU, utilisez ces méthodes pour sauvegarder vos résultats :

# Dans votre script Lambda GPU:
from clouditia_manager import GPUManager

manager = GPUManager(api_key="sk_compute_xxxxx")

# 1. Configurer la connexion S3
s3 = manager.s3_connect(
    bucket="mon-bucket",
    access_key="AWS_ACCESS_KEY_ID",
    secret_key="AWS_SECRET_ACCESS_KEY"
)

# 2. Sauvegarder un objet Python (auto-détection du format)
model = {"weights": [...], "config": {...}}
url = manager.lambda_output("model.pt", model, s3=s3)
# Output: Uploaded: model.pt -> https://mon-bucket.s3.amazonaws.com/model.pt

# 3. Sauvegarder des résultats JSON
results = {"accuracy": 0.95, "loss": 0.05}
url = manager.lambda_output("results.json", results, s3=s3)

# 4. Sauvegarder un tenseur PyTorch
import torch
model = torch.nn.Linear(10, 5)
url = manager.lambda_output("model.pt", model.state_dict(), s3=s3)

# 5. Uploader un fichier existant
url = manager.lambda_output_file("/tmp/checkpoint.pt", s3=s3)
# Output: Uploaded: checkpoint.pt -> https://mon-bucket.s3.amazonaws.com/checkpoint.pt

# 6. Uploader avec un nom personnalisé
url = manager.lambda_output_file(
    "/tmp/checkpoint.pt",
    s3=s3,
    remote_filename="checkpoints/epoch_10.pt"
)

Formats supportés par lambda_output() :

.pt, .pth : Modèles/tenseurs PyTorch (via torch.save)
.npy, .npz : Arrays NumPy (via numpy.save)
.json : Données JSON-sérialisables
.pkl, .pickle : Objets pickle
Bytes bruts
Chaînes de caractères

Installation avec support S3 :

pip install clouditia-manager[s3]  # Inclut boto3

21. Exemple complet Lambda GPU avec S3

from clouditia_manager import GPUManager
import torch

manager = GPUManager(api_key="sk_compute_xxxxx")

# Configurer S3
s3 = manager.s3_connect(
    bucket="ml-results",
    access_key="AKIAIOSFODNN7EXAMPLE",
    secret_key="wJalrXUtnFEMI/K7MDENG/bPxRfiCYEXAMPLEKEY",
    prefix="training/run_001/"
)

# Entraîner un modèle
model = torch.nn.Sequential(
    torch.nn.Linear(784, 256),
    torch.nn.ReLU(),
    torch.nn.Linear(256, 10)
)

# ... entraînement ...

results = {
    "accuracy": 0.95,
    "epochs": 10,
    "loss_history": [0.5, 0.3, 0.1]
}

# Sauvegarder les résultats vers S3
manager.lambda_output("model.pt", model.state_dict(), s3=s3)
manager.lambda_output("metrics.json", results, s3=s3)

# Envoyer une notification par email
manager.send_email(
    subject="Training Complete",
    message=f"Accuracy: {results['accuracy']}"
)

print("Training complete, results saved to S3!")

22. Envoyer un email de notification

# Envoyer un email à votre adresse enregistrée
manager.send_email(
    subject="Training Complete",
    message="Your model training has finished with 95% accuracy!"
)
# Output: Email sent to your@email.com

23. Limites automatiques (Auto-stop)

Définissez des limites de coût ou de durée pour arrêter automatiquement une session.

# Limite de coût: auto-stop quand le coût atteint 5 EUR
session = manager.create_session(
    gpu_type="nvidia-rtx-3090",
    vcpu=4,
    ram=16,
    cost_limit=5.0  # Max 5 EUR
)

# Limite de durée: auto-stop après 2 heures (7200 secondes)
session = manager.create_session(
    gpu_type="nvidia-rtx-3090",
    vcpu=4,
    ram=16,
    duration_limit=7200  # Max 2 heures
)

# Les deux limites ensemble: arrêt dès que l'une est atteinte
session = manager.create_session(
    gpu_type="nvidia-rtx-3090",
    vcpu=4,
    ram=16,
    cost_limit=10.0,      # Max 10 EUR
    duration_limit=3600   # OU max 1 heure
)

# Output avec limites:
# ==================================================
#   SESSION READY
# ==================================================
#   Name     : compute-gpu-0e4c713a
#   Short ID : 0e4c713a
#   Status   : running
#   GPU      : nvidia-rtx-3090 x1
#   vCPU     : 4
#   RAM      : 16Gi
#   Storage  : 20Gi
#   ----------------------------------------------
#   AUTO-STOP ENABLED
#   Cost Limit     : 10.0 EUR
#   Duration Limit : 1h 0m (3600s)
#   ----------------------------------------------
#   URL      : https://clouditia.com/code-editor/...
#   Password : xxxxxxxxxxxx
# ==================================================

# Vérifier les limites d'une session
print(f"Auto-stop activé: {session.auto_stop_enabled}")
print(f"Limite coût: {session.cost_limit} EUR")
print(f"Limite durée: {session.duration_limit} secondes")

Gestion des erreurs

from clouditia_manager import (
    GPUManager,
    AuthenticationError,
    SessionNotFoundError,
    InsufficientResourcesError,
    APIError
)

try:
    manager = GPUManager(api_key="sk_compute_xxxxx")
    session = manager.create_session(gpu_type="nvidia-rtx-4090")
except AuthenticationError:
    print("Clé API invalide")
except InsufficientResourcesError:
    print("Aucun GPU disponible")
except SessionNotFoundError:
    print("Session non trouvée")
except APIError as e:
    print(f"Erreur API: {e}")

Référence API

Méthode	Description
`GPUManager(api_key, base_url, timeout)`	Initialise le SDK
`create_session(gpu_type, gpu_count, gpus, vcpu, ram, storage, wait_ready, timeout, verbose, allow_partial, queue_if_unavailable, environment_id, cluster_id)`	Crée une session GPU (optionnel : `cluster_id` pour cibler un cluster)
`stop_session(session_id, wait_stopped, timeout, verbose)`	Arrête une session
`get_session(session_id)`	Récupère les détails d'une session
`list_sessions(status)`	Liste les sessions (filtre optionnel)
`rename_session(session_id, new_name)`	Renomme une session
`get_inventory(cluster_id)`	Récupère les GPUs disponibles (optionnel : `cluster_id` pour filtrer par cluster)
`list_clusters()`	Liste les clusters Kubernetes disponibles
`generate_sdk_key(session_id, name)`	Génère une clé sk_live_
`get_balance()`	Récupère le solde de crédits
`get_session_cost(session_id)`	Récupère le coût et la durée d'une session
`get_session_duration(session_id)`	Récupère la durée d'une session
`get_sessions_cost(session_ids)`	Récupère le coût de plusieurs sessions
`get_active_sessions_cost()`	Récupère le coût de toutes les sessions actives
`list_queue_jobs(status)`	Liste les jobs en queue (filtre optionnel)
`get_queue_job(queue_id, verbose)`	Récupère les détails d'un job en queue avec historique
`cancel_queue_job(queue_id, verbose)`	Annule un job en queue
`lambda_gpu(script, gpu_type, environment_id, ...)`	Exécution serverless sur GPU
`run_and_stop(script, gpu_type, ...)`	Exécution avec session complète (upload/download fichiers, S3)
`s3_connect(bucket, access_key, secret_key, ...)`	Crée une connexion S3 pour les outputs
`lambda_output(filename, data, s3)`	Sauvegarde un objet Python vers S3
`lambda_output_file(filepath, s3)`	Upload un fichier existant vers S3
`send_email(subject, message)`	Envoie un email de notification

Attributs GPUSession

Attribut	Type	Description
`id`	str	UUID complet de la session
`short_id`	str	ID court (8 caractères)
`name`	str	Nom de la session
`status`	str	running, stopped, pending, failed
`ready`	bool	`True` uniquement si la session est pleinement utilisable (status `running` ET tout téléchargement workspace en arrière-plan terminé)
`estimated_ready_in_seconds`	int \| None	ETA en secondes avant que `ready` passe à `True` (`0` si déjà prêt)
`workspace_sync`	dict \| None	Progression du restore workspace pour les sessions reprises depuis un custom env : `{in_progress, bytes_done, bytes_total, files_done, pct, rate_bps, eta_seconds}`
`gpu_type`	str	Type(s) de GPU (séparés par virgule si multi-GPU)
`gpu_count`	int	Nombre total de GPUs
`gpus`	list	Liste des configurations GPU (pour multi-GPU)
`vcpu`	int	Nombre de vCPUs
`ram`	str	RAM allouée
`storage`	str	Stockage alloué
`url`	str	URL d'accès
`password`	str	Mot de passe

Attributs GPUInventory

Attribut	Type	Description
`gpu_type`	str	Slug du GPU
`gpu_name`	str	Nom complet du GPU
`available`	int	Nombre de GPUs disponibles
`price_per_hour`	float	Prix par heure (EUR)

Attributs Cluster

Attribut	Type	Description
`cluster_id`	str	UUID du cluster
`name`	str	Nom du cluster
`is_primary`	bool	`True` si c'est le cluster principal
`gpu_count`	int	Nombre total de GPUs dans le cluster

Attributs QueueJob

Attribut	Type	Description
`queue_id`	str	UUID du job en queue
`position`	int	Position dans la queue
`status`	str	pending, processing, completed, failed, cancelled
`status_display`	str	Libellé du status (traduit)
`gpu_config`	dict	Configuration GPU demandée
`vcpu`	int	Nombre de vCPUs demandés
`ram`	int	RAM demandée (GB)
`storage`	int	Stockage demandé (GB)
`allow_partial`	bool	Autoriser création partielle
`attempt_count`	int	Nombre de tentatives
`last_attempt_at`	datetime	Date de la dernière tentative
`last_error`	str	Dernière erreur rencontrée
`created_at`	datetime	Date de création
`created_session_id`	str	ID de la session créée (si succès)

Attributs QueueAttempt

Attribut	Type	Description
`attempt_id`	str	UUID de la tentative
`success`	bool	Succès ou échec
`error_message`	str	Message d'erreur
`available_gpus`	list	GPUs disponibles au moment de la tentative
`unavailable_gpus`	list	GPUs indisponibles au moment de la tentative
`attempted_at`	datetime	Date et heure de la tentative

Attributs LambdaResult

Attribut	Type	Description
`success`	bool	True si exit_code == 0
`exit_code`	int	Code de sortie du script
`stdout`	str	Sortie standard du script
`stderr`	str	Sortie d'erreur du script
`output_files`	list	Liste des fichiers téléchargés
`session_id`	str	ID court de la session utilisée
`duration_seconds`	float	Durée totale en secondes
`cost`	float	Coût de l'exécution en EUR
`error`	str	Message d'erreur (si échec)

License

MIT License

Project details

These details have not been verified by PyPI

Project links

Release history Release notifications | RSS feed

1.14.3

May 22, 2026

1.14.2

May 22, 2026

1.14.1

May 22, 2026

1.14.0

May 21, 2026

1.13.1

May 21, 2026

1.13.0

May 21, 2026

1.12.0

May 21, 2026

1.11.3

May 21, 2026

1.11.2

May 21, 2026

1.11.1

May 21, 2026

This version

1.11.0

May 21, 2026

1.10.1

May 5, 2026

1.10.0

Apr 26, 2026

1.9.1

Apr 1, 2026

1.9.0

Apr 1, 2026

1.8.1

Mar 31, 2026

1.8.0

Jan 9, 2026

1.7.0

Jan 9, 2026

1.6.0

Jan 9, 2026

1.5.0

Jan 9, 2026

1.4.0

Jan 9, 2026

1.3.2

Jan 9, 2026

1.3.1

Jan 9, 2026

1.2.2

Jan 9, 2026

1.2.1

Jan 9, 2026

1.2.0

Jan 9, 2026

1.1.0

Jan 9, 2026

1.0.0

Jan 9, 2026

Download files

Download the file for your platform. If you're not sure which to choose, learn more about installing packages.

Source Distribution

clouditia_manager-1.11.0.tar.gz (39.7 kB view details)

Uploaded May 21, 2026 Source

Built Distribution

If you're not sure about the file name format, learn more about wheel file names.

The dropdown lists show the available interpreters, ABIs, and platforms. Enable javascript to be able to filter the list of wheel files.

clouditia_manager-1.11.0-py3-none-any.whl (27.8 kB view details)

Uploaded May 21, 2026 Python 3

File details

Details for the file clouditia_manager-1.11.0.tar.gz.

File metadata

Download URL: clouditia_manager-1.11.0.tar.gz
Upload date: May 21, 2026
Size: 39.7 kB
Tags: Source
Uploaded using Trusted Publishing? No
Uploaded via: twine/6.2.0 CPython/3.12.3

File hashes

Hashes for clouditia_manager-1.11.0.tar.gz
Algorithm	Hash digest
SHA256	`9955826ef019d6eebd91961e6b5d8939b0eb5412604b9659ab41f022c835a12e`
MD5	`fd8fa2327a2df0da0e5f575d45a39874`
BLAKE2b-256	`618d0abd1e9c74412a170bc7006bf1df1164cdd2672d6fd16ab11fbfffd0c0d4`

See more details on using hashes here.

File details

Details for the file clouditia_manager-1.11.0-py3-none-any.whl.

File metadata

Download URL: clouditia_manager-1.11.0-py3-none-any.whl
Upload date: May 21, 2026
Size: 27.8 kB
Tags: Python 3
Uploaded using Trusted Publishing? No
Uploaded via: twine/6.2.0 CPython/3.12.3

File hashes

Hashes for clouditia_manager-1.11.0-py3-none-any.whl
Algorithm	Hash digest
SHA256	`2b5e0b588e3e612391021f87d5174f9bd6fb346bedadc25937088159834d5c43`
MD5	`207e6cc84191cb7309c0653df34bbff3`
BLAKE2b-256	`7c43522fac15b67942049d2d8c6fcc694595b28b727135fe8ad94daa4ce5e207`

See more details on using hashes here.

clouditia-manager 1.11.0

Navigation

Verified details

Maintainers

Unverified details

Project links

Meta

Classifiers

Project description

Clouditia Manager SDK

Installation

Quick Start

Configuration

Fonctionnalités

1. Vérifier la clé API

2. Créer une session GPU (Single GPU)

Sessions reprises depuis un custom env (workspace restore)

3. Créer une session Multi-GPU (plusieurs types de GPU)

4. Gestion de la disponibilité GPU (allow_partial)

5. Lister les sessions

5. Obtenir le status d'une session

6. Renommer une session

7. Arrêter une session

8. Consulter les GPUs disponibles

8b. Lister les clusters disponibles

9. Générer une clé SDK (sk_live_)

10. Consulter le solde de crédits

11. Coût et durée d'une session

12. Coût de plusieurs sessions

13. Coût de toutes les sessions actives

14. File d'attente (Queue) pour création de session

15. Lister les jobs en queue

16. Voir les détails d'un job en queue

17. Annuler un job en queue

18. Lambda GPU (Exécution Serverless)

18b. run_and_stop() (Exécution avec session complète)

19. Connexion S3 pour Lambda GPU

20. Sauvegarder des outputs vers S3

21. Exemple complet Lambda GPU avec S3

22. Envoyer un email de notification

23. Limites automatiques (Auto-stop)

Gestion des erreurs

Référence API

Attributs GPUSession

Attributs GPUInventory

Attributs Cluster

Attributs QueueJob

Attributs QueueAttempt

Attributs LambdaResult

License

Project details

Verified details

Maintainers

Unverified details

Project links

Meta

Classifiers

Release history Release notifications | RSS feed

Download files

Source Distribution

Built Distribution

File details

File metadata

File hashes

File details

File metadata

File hashes