Skip to main content

No project description provided

Project description

LLM Common

AGENTS.md промпт для подключения метрик в проект, там информация более подробная.

Общая библиотека для работы с LLM приложениями, включающая инструменты для мониторинга с Prometheus и HTTP клиенты с встроенным трекингом метрик.

Есть готовые дашборды для этих метрик. После интеграции в свой проект, вы увидите метрики на этих дашбордах.

Для фабрики микросервисов:

Для llmgpu серверов (вос 28):

🚀 Основные возможности

  • Prometheus мониторинг: Полнофункциональная система метрик для HTTP запросов и действий приложения
  • HTTP клиенты: Готовые к использованию HTTP клиенты для LLM и аутентификации с автоматическим трекингом
  • Декораторы и контекст-менеджеры: Готовые примитивы для отслеживания
  • FastAPI интеграция: Middleware для отслеживания http метрик и endpoint для экспорта метрик
  • Flask интеграция: endpoint для экспорта метрик

📦 Установка

Python 3.11+

pip install llm_common prometheus_client
uv add llm_common prometheus_client

Из исходного кода

git clone <repository-url>
cd llm_common
pip install -e .

Для разработки

git clone <repository-url>
cd llm_common
pip install -e ".[dev]"
pre-commit install

🔧 Быстрый старт

pip install llm_common

1. Инициализация метрик

from llm_common.prometheus import build_prometheus_metrics

# Инициализация системы мониторинга
metrics = build_prometheus_metrics(
    project_name="projectname",
    env="dev"  # dev, preprod, или prod
)

2. Использование HTTP клиентов

from llm_common.clients.llm_http_client import LLMHttpClient
from langchain_openai import ChatOpenAI

# LLM клиент с OpenAI интеграцией и мониторингом
custom_aclient = LLMHttpClient(verify=False)

chat_model = ChatOpenAI(
    ...,
    http_async_client=custom_aclient,
)
from llm_common.clients.auth_client import AuthHttpClient

async with AuthHttpClient() as client:
    response = await client.post("https://auth-service.com/api/check")

3. Трекинг действий

from llm_common.prometheus import action_tracking, action_tracking_decorator

# Использование контекст-менеджера
with action_tracking("data_processing") as tracker:
    # Ваш код
    process_data()
    # Опционально: трекинг размера данных
    tracker.size(len(processed_data))

# Использование декоратора
@action_tracking_decorator("llm_request")
async def make_llm_request():
    # Ваш код
    return result

4. Интеграция с FastAPI

from fastapi import FastAPI
from llm_common.prometheus import fastapi_tracking_middleware, fastapi_endpoint_for_prometheus

app = FastAPI()

# Добавление middleware для трекинга HTTP запросов
app.middleware("http")(fastapi_tracking_middleware)

# Endpoint для экспорта метрик Prometheus
app.get("/prometheus")(fastapi_endpoint_for_prometheus)

📖 API Документация

HTTP Клиенты

LLMHttpClient

class LLMHttpClient(HttpxClientWithMonitoring):
    """HTTP клиент для LLM запросов с автоматическим мониторингом"""
    name_for_monitoring = "llm"

AuthHttpClient

class AuthHttpClient(HttpxClientWithMonitoring):
    """HTTP клиент для аутентификации с кастомной обработкой путей"""
    name_for_monitoring = "auth_api"

Утилиты мониторинга

action_tracking(name: str)

Контекст-менеджер для отслеживания действий:

  • Автоматически измеряет время выполнения
  • Подсчитывает успешные и ошибочные выполнения
  • Позволяет трекить размер обработанных данных

action_tracking_decorator(name: str)

Декоратор для функций и корутин, поддерживает все возможности action_tracking.

http_tracking(...)

Функция для ручного трекинга HTTP запросов с подробными параметрами.

🔍 Метрики и мониторинг

Доступные метрики

Все метрики имеют префикс genapp_:

HTTP метрики:

  • genapp_http_requests_total - Общее количество HTTP запросов
  • genapp_http_request_duration_sec - Гистограмма времени выполнения
  • genapp_http_request_size_bytes - Размер запросов/ответов

Метрики действий:

  • genapp_action_count_total - Количество выполненных действий
  • genapp_action_duration_sec - Время выполнения действий
  • genapp_action_size_total - Размер обработанных данных

Labels (теги)

Метрики содержат стандартные labels:

  • env - Окружение (dev/preprod/prod)
  • app - Название приложения
  • app_type - Тип приложения (telegram_api, llm, app_api, etc.)
  • method - HTTP метод
  • status - Статус ответа/результата
  • resource - Путь ресурса (очищенный от ID)

🛠️ Разработка

Требования

  • Python 3.11+
  • httpx
  • prometheus_client

Инструменты разработки

  • ruff - Линтер и форматтер
  • black - Форматирование кода
  • pre-commit - Хуки для проверки кода
  • vulture - Поиск неиспользуемого кода

Запуск линтеров

ruff check llm_common
ruff format llm_common
black llm_common

Pre-commit хуки

pre-commit install
pre-commit run --all-files

📝 Примеры использования

Полный пример FastAPI приложения

from fastapi import FastAPI
from llm_common.prometheus import (
    build_prometheus_metrics,
    fastapi_tracking_middleware,
    fastapi_endpoint_for_prometheus,
    action_tracking_decorator
)

# Инициализация метрик
build_prometheus_metrics(project_name="my_llm_service", env="dev")

app = FastAPI()
app.middleware("http")(fastapi_tracking_middleware)
app.get("/prometheus")(fastapi_endpoint_for_prometheus)

Пример с ручным трекингом

from llm_common.prometheus import action_tracking

def process_large_dataset(data):
    with action_tracking("dataset_processing") as tracker:
        # Обработка данных
        processed_data = []
        for item in data:
            processed_item = transform(item)
            processed_data.append(processed_item)
        
        # Трекинг размера обработанных данных
        tracker.size(len(processed_data))
        
        return processed_data

🤖 Для LLM моделей

Эта библиотека предоставляет готовые инструменты для:

  1. Мониторинга LLM запросов: Используйте LLMHttpClient в качестве http_async_client для ChatOpenAI и других LLM клиентов для автоматического трекинга всех запросов к LLM API
  2. Интеграции с OpenAI/LangChain: Передавайте LLMHttpClient в параметр http_async_client для получения метрик без изменения кода работы с LLM
  3. Отслеживания производительности: Декораторы @action_tracking_decorator для мониторинга функций обработки
  4. Интеграции в веб-сервисы: FastAPI middleware для полного мониторинга веб-приложений
  5. Экспорта метрик: Готовый endpoint /prometheus для интеграции с Prometheus/Grafana

Все метрики собираются автоматически и готовы для использования в системах мониторинга.

Project details


Download files

Download the file for your platform. If you're not sure which to choose, learn more about installing packages.

Source Distribution

llm_common-2.4.0.tar.gz (12.3 kB view details)

Uploaded Source

Built Distribution

If you're not sure about the file name format, learn more about wheel file names.

llm_common-2.4.0-py3-none-any.whl (11.5 kB view details)

Uploaded Python 3

File details

Details for the file llm_common-2.4.0.tar.gz.

File metadata

  • Download URL: llm_common-2.4.0.tar.gz
  • Upload date:
  • Size: 12.3 kB
  • Tags: Source
  • Uploaded using Trusted Publishing? No
  • Uploaded via: uv/0.6.3

File hashes

Hashes for llm_common-2.4.0.tar.gz
Algorithm Hash digest
SHA256 b4264515609c1fc9ceefa5958b95676326785e531c4c9807121fd285761c2e11
MD5 d04b831c16f17e93b012d3009f57246f
BLAKE2b-256 9a8fbd55b2bc0891fe6854b00c2c514918a4629cbca52c80a07c4915c2256682

See more details on using hashes here.

File details

Details for the file llm_common-2.4.0-py3-none-any.whl.

File metadata

  • Download URL: llm_common-2.4.0-py3-none-any.whl
  • Upload date:
  • Size: 11.5 kB
  • Tags: Python 3
  • Uploaded using Trusted Publishing? No
  • Uploaded via: uv/0.6.3

File hashes

Hashes for llm_common-2.4.0-py3-none-any.whl
Algorithm Hash digest
SHA256 27c47551e0d255c2f27f2904795b58ab85744c6fa998859544403a55b06811a7
MD5 d01cd7736986f005a797664ba95ef621
BLAKE2b-256 84790ffef79921a3834366eee790a9a5c523e9c28d921493083dc17166a22361

See more details on using hashes here.

Supported by

AWS Cloud computing and Security Sponsor Datadog Monitoring Depot Continuous Integration Fastly CDN Google Download Analytics Pingdom Monitoring Sentry Error logging StatusPage Status page