Skip to main content

No project description provided

Project description

LLM Common

AGENTS.md промпт для подключения метрик в проект, там информация более подробная.

Общая библиотека для работы с LLM приложениями, включающая инструменты для мониторинга с Prometheus и HTTP клиенты с встроенным трекингом метрик.

Есть готовые дашборды для этих метрик. После интеграции в свой проект, вы увидите метрики на этих дашбордах.

Для фабрики микросервисов:

Для llmgpu серверов (вос 28):

🚀 Основные возможности

  • Prometheus мониторинг: Полнофункциональная система метрик для HTTP запросов и действий приложения
  • HTTP клиенты: Готовые к использованию HTTP клиенты для LLM и аутентификации с автоматическим трекингом
  • Декораторы и контекст-менеджеры: Готовые примитивы для отслеживания
  • FastAPI интеграция: Middleware для отслеживания http метрик и endpoint для экспорта метрик
  • Flask интеграция: endpoint для экспорта метрик

📦 Установка

Python 3.11+

pip install llm_common prometheus_client
uv add llm_common prometheus_client

Из исходного кода

git clone <repository-url>
cd llm_common
pip install -e .

Для разработки

git clone <repository-url>
cd llm_common
pip install -e ".[dev]"
pre-commit install

🔧 Быстрый старт

pip install llm_common

1. Инициализация метрик

from llm_common.prometheus import build_prometheus_metrics

# Инициализация системы мониторинга
metrics = build_prometheus_metrics(
    project_name="projectname",
    env="dev"  # dev, preprod, или prod
)

2. Использование HTTP клиентов

from llm_common.clients.llm_http_client import LLMHttpClient
from langchain_openai import ChatOpenAI

# LLM клиент с OpenAI интеграцией и мониторингом
custom_aclient = LLMHttpClient(verify=False)

chat_model = ChatOpenAI(
    ...,
    http_async_client=custom_aclient,
)
from llm_common.clients.auth_client import AuthHttpClient

async with AuthHttpClient() as client:
    response = await client.post("https://auth-service.com/api/check")

3. Трекинг действий

from llm_common.prometheus import action_tracking, action_tracking_decorator

# Использование контекст-менеджера
with action_tracking("data_processing") as tracker:
    # Ваш код
    process_data()
    # Опционально: трекинг размера данных
    tracker.size(len(processed_data))

# Использование декоратора
@action_tracking_decorator("llm_request")
async def make_llm_request():
    # Ваш код
    return result

4. Интеграция с FastAPI

from fastapi import FastAPI
from llm_common.prometheus import fastapi_tracking_middleware, fastapi_endpoint_for_prometheus

app = FastAPI()

# Добавление middleware для трекинга HTTP запросов
app.middleware("http")(fastapi_tracking_middleware)

# Endpoint для экспорта метрик Prometheus
app.get("/prometheus")(fastapi_endpoint_for_prometheus)

📖 API Документация

HTTP Клиенты

LLMHttpClient

class LLMHttpClient(HttpxClientWithMonitoring):
    """HTTP клиент для LLM запросов с автоматическим мониторингом"""
    name_for_monitoring = "llm"

AuthHttpClient

class AuthHttpClient(HttpxClientWithMonitoring):
    """HTTP клиент для аутентификации с кастомной обработкой путей"""
    name_for_monitoring = "auth_api"

Утилиты мониторинга

action_tracking(name: str)

Контекст-менеджер для отслеживания действий:

  • Автоматически измеряет время выполнения
  • Подсчитывает успешные и ошибочные выполнения
  • Позволяет трекить размер обработанных данных

action_tracking_decorator(name: str)

Декоратор для функций и корутин, поддерживает все возможности action_tracking.

http_tracking(...)

Функция для ручного трекинга HTTP запросов с подробными параметрами.

🔍 Метрики и мониторинг

Доступные метрики

Все метрики имеют префикс genapp_:

HTTP метрики:

  • genapp_http_requests_total - Общее количество HTTP запросов
  • genapp_http_request_duration_sec - Гистограмма времени выполнения
  • genapp_http_request_size_bytes - Размер запросов/ответов

Метрики действий:

  • genapp_action_count_total - Количество выполненных действий
  • genapp_action_duration_sec - Время выполнения действий
  • genapp_action_size_total - Размер обработанных данных

Labels (теги)

Метрики содержат стандартные labels:

  • env - Окружение (dev/preprod/prod)
  • app - Название приложения
  • app_type - Тип приложения (telegram_api, llm, app_api, etc.)
  • method - HTTP метод
  • status - Статус ответа/результата
  • resource - Путь ресурса (очищенный от ID)

🛠️ Разработка

Требования

  • Python 3.11+
  • httpx
  • prometheus_client

Инструменты разработки

  • ruff - Линтер и форматтер
  • black - Форматирование кода
  • pre-commit - Хуки для проверки кода
  • vulture - Поиск неиспользуемого кода

Запуск линтеров

ruff check llm_common
ruff format llm_common
black llm_common

Pre-commit хуки

pre-commit install
pre-commit run --all-files

📝 Примеры использования

Полный пример FastAPI приложения

from fastapi import FastAPI
from llm_common.prometheus import (
    build_prometheus_metrics,
    fastapi_tracking_middleware,
    fastapi_endpoint_for_prometheus,
    action_tracking_decorator
)

# Инициализация метрик
build_prometheus_metrics(project_name="my_llm_service", env="dev")

app = FastAPI()
app.middleware("http")(fastapi_tracking_middleware)
app.get("/prometheus")(fastapi_endpoint_for_prometheus)

Пример с ручным трекингом

from llm_common.prometheus import action_tracking

def process_large_dataset(data):
    with action_tracking("dataset_processing") as tracker:
        # Обработка данных
        processed_data = []
        for item in data:
            processed_item = transform(item)
            processed_data.append(processed_item)
        
        # Трекинг размера обработанных данных
        tracker.size(len(processed_data))
        
        return processed_data

🤖 Для LLM моделей

Эта библиотека предоставляет готовые инструменты для:

  1. Мониторинга LLM запросов: Используйте LLMHttpClient в качестве http_async_client для ChatOpenAI и других LLM клиентов для автоматического трекинга всех запросов к LLM API
  2. Интеграции с OpenAI/LangChain: Передавайте LLMHttpClient в параметр http_async_client для получения метрик без изменения кода работы с LLM
  3. Отслеживания производительности: Декораторы @action_tracking_decorator для мониторинга функций обработки
  4. Интеграции в веб-сервисы: FastAPI middleware для полного мониторинга веб-приложений
  5. Экспорта метрик: Готовый endpoint /prometheus для интеграции с Prometheus/Grafana

Все метрики собираются автоматически и готовы для использования в системах мониторинга.

Project details


Download files

Download the file for your platform. If you're not sure which to choose, learn more about installing packages.

Source Distribution

llm_common-2.4.1.tar.gz (12.3 kB view details)

Uploaded Source

Built Distribution

If you're not sure about the file name format, learn more about wheel file names.

llm_common-2.4.1-py3-none-any.whl (11.5 kB view details)

Uploaded Python 3

File details

Details for the file llm_common-2.4.1.tar.gz.

File metadata

  • Download URL: llm_common-2.4.1.tar.gz
  • Upload date:
  • Size: 12.3 kB
  • Tags: Source
  • Uploaded using Trusted Publishing? No
  • Uploaded via: uv/0.6.3

File hashes

Hashes for llm_common-2.4.1.tar.gz
Algorithm Hash digest
SHA256 adfb094c3456f1d2c6cb19135b12dd8cc49bb26aa99c42e73abe019b20bef3a5
MD5 46d8133217e9c9c448bfba66bc55ac03
BLAKE2b-256 38c223d1ee99f30099d95295bb65a5d24e2c8104d5b8ecd75a7cb678576ea320

See more details on using hashes here.

File details

Details for the file llm_common-2.4.1-py3-none-any.whl.

File metadata

  • Download URL: llm_common-2.4.1-py3-none-any.whl
  • Upload date:
  • Size: 11.5 kB
  • Tags: Python 3
  • Uploaded using Trusted Publishing? No
  • Uploaded via: uv/0.6.3

File hashes

Hashes for llm_common-2.4.1-py3-none-any.whl
Algorithm Hash digest
SHA256 58cc1cd64e2a91fd32f6b6461340201b6072fd66fbf48f1a966577e377c00b0d
MD5 a49408e5e54d9821941a762433b3d91a
BLAKE2b-256 8188d67089b884a9e944382c34b98c1f6df4b84f81bbf37fa5aa0ef4ca80250d

See more details on using hashes here.

Supported by

AWS Cloud computing and Security Sponsor Datadog Monitoring Depot Continuous Integration Fastly CDN Google Download Analytics Pingdom Monitoring Sentry Error logging StatusPage Status page