Skip to main content

No project description provided

Project description

LLM Common

AGENTS.md промпт для подключения метрик в проект, там информация более подробная.

Общая библиотека для работы с LLM приложениями, включающая инструменты для мониторинга с Prometheus и HTTP клиенты с встроенным трекингом метрик.

Есть готовые дашборды для этих метрик. После интеграции в свой проект, вы увидите метрики на этих дашбордах.

Для фабрики микросервисов:

Для llmgpu серверов (вос 28):

🚀 Основные возможности

  • Prometheus мониторинг: Полнофункциональная система метрик для HTTP запросов и действий приложения
  • HTTP клиенты: Готовые к использованию HTTP клиенты для LLM и аутентификации с автоматическим трекингом
  • Декораторы и контекст-менеджеры: Готовые примитивы для отслеживания
  • FastAPI интеграция: Middleware для отслеживания http метрик и endpoint для экспорта метрик
  • Flask интеграция: endpoint для экспорта метрик

📦 Установка

Python 3.11+

pip install llm_common prometheus_client
uv add llm_common prometheus_client

Из исходного кода

git clone <repository-url>
cd llm_common
pip install -e .

Для разработки

git clone <repository-url>
cd llm_common
pip install -e ".[dev]"
pre-commit install

🔧 Быстрый старт

pip install llm_common

1. Инициализация метрик

from llm_common.prometheus import build_prometheus_metrics

# Инициализация системы мониторинга
metrics = build_prometheus_metrics(
    project_name="projectname",
    env="dev"  # dev, preprod, или prod
)

2. Использование HTTP клиентов

from llm_common.clients.llm_http_client import LLMHttpClient
from langchain_openai import ChatOpenAI

# LLM клиент с OpenAI интеграцией и мониторингом
custom_aclient = LLMHttpClient(verify=False)

chat_model = ChatOpenAI(
    ...,
    http_async_client=custom_aclient,
)
from llm_common.clients.auth_client import AuthHttpClient

async with AuthHttpClient() as client:
    response = await client.post("https://auth-service.com/api/check")

3. Трекинг действий

from llm_common.prometheus import action_tracking, action_tracking_decorator

# Использование контекст-менеджера
with action_tracking("data_processing") as tracker:
    # Ваш код
    process_data()
    # Опционально: трекинг размера данных
    tracker.size(len(processed_data))

# Использование декоратора
@action_tracking_decorator("llm_request")
async def make_llm_request():
    # Ваш код
    return result

4. Интеграция с FastAPI

from fastapi import FastAPI
from llm_common.prometheus import fastapi_tracking_middleware, fastapi_endpoint_for_prometheus

app = FastAPI()

# Добавление middleware для трекинга HTTP запросов
app.middleware("http")(fastapi_tracking_middleware)

# Endpoint для экспорта метрик Prometheus
app.get("/prometheus")(fastapi_endpoint_for_prometheus)

📖 API Документация

HTTP Клиенты

LLMHttpClient

class LLMHttpClient(HttpxClientWithMonitoring):
    """HTTP клиент для LLM запросов с автоматическим мониторингом"""
    name_for_monitoring = "llm"

AuthHttpClient

class AuthHttpClient(HttpxClientWithMonitoring):
    """HTTP клиент для аутентификации с кастомной обработкой путей"""
    name_for_monitoring = "auth_api"

Утилиты мониторинга

action_tracking(name: str)

Контекст-менеджер для отслеживания действий:

  • Автоматически измеряет время выполнения
  • Подсчитывает успешные и ошибочные выполнения
  • Позволяет трекить размер обработанных данных

action_tracking_decorator(name: str)

Декоратор для функций и корутин, поддерживает все возможности action_tracking.

http_tracking(...)

Функция для ручного трекинга HTTP запросов с подробными параметрами.

🔍 Метрики и мониторинг

Доступные метрики

Все метрики имеют префикс genapp_:

HTTP метрики:

  • genapp_http_requests_total - Общее количество HTTP запросов
  • genapp_http_request_duration_sec - Гистограмма времени выполнения
  • genapp_http_request_size_bytes - Размер запросов/ответов

Метрики действий:

  • genapp_action_count_total - Количество выполненных действий
  • genapp_action_duration_sec - Время выполнения действий
  • genapp_action_size_total - Размер обработанных данных

Labels (теги)

Метрики содержат стандартные labels:

  • env - Окружение (dev/preprod/prod)
  • app - Название приложения
  • app_type - Тип приложения (telegram_api, llm, app_api, etc.)
  • method - HTTP метод
  • status - Статус ответа/результата
  • resource - Путь ресурса (очищенный от ID)

🛠️ Разработка

Требования

  • Python 3.11+
  • httpx
  • prometheus_client

Инструменты разработки

  • ruff - Линтер и форматтер
  • black - Форматирование кода
  • pre-commit - Хуки для проверки кода
  • vulture - Поиск неиспользуемого кода

Запуск линтеров

ruff check llm_common
ruff format llm_common
black llm_common

Pre-commit хуки

pre-commit install
pre-commit run --all-files

📝 Примеры использования

Полный пример FastAPI приложения

from fastapi import FastAPI
from llm_common.prometheus import (
    build_prometheus_metrics,
    fastapi_tracking_middleware,
    fastapi_endpoint_for_prometheus,
    action_tracking_decorator
)

# Инициализация метрик
build_prometheus_metrics(project_name="my_llm_service", env="dev")

app = FastAPI()
app.middleware("http")(fastapi_tracking_middleware)
app.get("/prometheus")(fastapi_endpoint_for_prometheus)

Пример с ручным трекингом

from llm_common.prometheus import action_tracking

def process_large_dataset(data):
    with action_tracking("dataset_processing") as tracker:
        # Обработка данных
        processed_data = []
        for item in data:
            processed_item = transform(item)
            processed_data.append(processed_item)
        
        # Трекинг размера обработанных данных
        tracker.size(len(processed_data))
        
        return processed_data

🤖 Для LLM моделей

Эта библиотека предоставляет готовые инструменты для:

  1. Мониторинга LLM запросов: Используйте LLMHttpClient в качестве http_async_client для ChatOpenAI и других LLM клиентов для автоматического трекинга всех запросов к LLM API
  2. Интеграции с OpenAI/LangChain: Передавайте LLMHttpClient в параметр http_async_client для получения метрик без изменения кода работы с LLM
  3. Отслеживания производительности: Декораторы @action_tracking_decorator для мониторинга функций обработки
  4. Интеграции в веб-сервисы: FastAPI middleware для полного мониторинга веб-приложений
  5. Экспорта метрик: Готовый endpoint /prometheus для интеграции с Prometheus/Grafana

Все метрики собираются автоматически и готовы для использования в системах мониторинга.

Project details


Download files

Download the file for your platform. If you're not sure which to choose, learn more about installing packages.

Source Distribution

llm_common-2.5.2.tar.gz (18.4 kB view details)

Uploaded Source

Built Distribution

If you're not sure about the file name format, learn more about wheel file names.

llm_common-2.5.2-py3-none-any.whl (19.1 kB view details)

Uploaded Python 3

File details

Details for the file llm_common-2.5.2.tar.gz.

File metadata

  • Download URL: llm_common-2.5.2.tar.gz
  • Upload date:
  • Size: 18.4 kB
  • Tags: Source
  • Uploaded using Trusted Publishing? No
  • Uploaded via: uv/0.6.3

File hashes

Hashes for llm_common-2.5.2.tar.gz
Algorithm Hash digest
SHA256 b398fb156f43efd88c05307d4fa3a63358fdd870ad2741bb9846fa0cb40bfb1d
MD5 8140100ac2ad4ce1815a144c7fd3f550
BLAKE2b-256 662c41994c8c13fcd919d8341c41a491effd332bada2d3f0f06af663356ab3aa

See more details on using hashes here.

File details

Details for the file llm_common-2.5.2-py3-none-any.whl.

File metadata

File hashes

Hashes for llm_common-2.5.2-py3-none-any.whl
Algorithm Hash digest
SHA256 1b01e420095fdf1aaa79f8a6388c450650b8002f72376b25c11af731592f1a14
MD5 26b55dc3ae64c0fcd13c44a2e4cff0ae
BLAKE2b-256 fb9b49670092b709882fc67adf6477e44f5765ae0c930ae5b725dbfc0dfe2362

See more details on using hashes here.

Supported by

AWS Cloud computing and Security Sponsor Datadog Monitoring Depot Continuous Integration Fastly CDN Google Download Analytics Pingdom Monitoring Sentry Error logging StatusPage Status page