Skip to main content

High-performance Russian speech recognition library based on GigaAM-style RNN-T and ONNX.

Project description

Kairos Automatic Speech Recognition

📄 Описание

Kairos ASR — высокопроизводительная библиотека распознавания русской речи на базе GigaAM-style RNN-T и ONNX. Фокус: скорость, точность и простая интеграция в микросервисы и десктопы.

Основные возможности:

  • Оптимизированный ONNX-инференс
  • CPU и GPU (CUDA, extra [gpu])
  • Временные метки (word-level, sentence-level)
  • Итеративная обработка с прогрессом и ETA
  • Встроенный Voice-Activity-Detection (VAD)
  • Поддержка длинных аудио
  • Поддержка Windows и Linux

⚡ Быстрый старт

pip install kairos-asr
# для GPU: pip install "kairos-asr[gpu]"

Если нужна конкретная сборка Torch под вашу CUDA:

# пример под CUDA 12.1/12.2 (cu121)
pip install torch==2.6.0 torchaudio==2.6.0 \
  --index-url https://download.pytorch.org/whl/cu121 --upgrade

🚀 Использование (Python)

Минимальный пример:

from kairos_asr import KairosASR

asr = KairosASR()  # авто-загрузка весов с HF
result = asr.transcribe(wav_file="audio.wav")
print(result.full_text)

Требования к аудио:

  • Любые форматы, поддерживаемые ffmpeg; ресемплинг до 16 kHz.
  • WAV PCM 16-bit mono (рекомендуется); стерео приводится к моно.
  • Длинные записи режутся Silero VAD на ~15–25 c (жёсткий лимит ~30 c) и объединяются.

🖥️ Использование (CLI)

Установите пакет, затем:

# Проверить окружение
kairos-asr doctor

# Список локальных/доступных моделей
kairos-asr list

# Скачать все модели заранее
kairos-asr download

# Перевести файл в текст
kairos-asr transcribe <wav_file>

⚙️ Системные требования

  • ffmpeg должен быть доступен в PATH (загрузка и ресемплинг аудио).
  • Доступ в интернет при первом запуске: скачивание весов с Hugging Face и модели Silero VAD через torch.hub. Для ускорения и избежания лимитов задайте HF_TOKEN (huggingface-cli login или экспорт переменной окружения).

Project details


Download files

Download the file for your platform. If you're not sure which to choose, learn more about installing packages.

Source Distribution

kairos_asr-0.6.4.tar.gz (323.5 kB view details)

Uploaded Source

Built Distribution

If you're not sure about the file name format, learn more about wheel file names.

kairos_asr-0.6.4-py3-none-any.whl (25.9 kB view details)

Uploaded Python 3

File details

Details for the file kairos_asr-0.6.4.tar.gz.

File metadata

  • Download URL: kairos_asr-0.6.4.tar.gz
  • Upload date:
  • Size: 323.5 kB
  • Tags: Source
  • Uploaded using Trusted Publishing? No
  • Uploaded via: twine/6.2.0 CPython/3.10.0

File hashes

Hashes for kairos_asr-0.6.4.tar.gz
Algorithm Hash digest
SHA256 895ce6e4ee4c5849b71c16abdcb3a01caa9a05862320ef0ae876be4c0984fa39
MD5 27894c2c88f13cfe760a300c7d5fedd0
BLAKE2b-256 4f656be6fe491302e2b2caa18d84da3735f3317a55652403c1b22d6cfb173fa9

See more details on using hashes here.

File details

Details for the file kairos_asr-0.6.4-py3-none-any.whl.

File metadata

  • Download URL: kairos_asr-0.6.4-py3-none-any.whl
  • Upload date:
  • Size: 25.9 kB
  • Tags: Python 3
  • Uploaded using Trusted Publishing? No
  • Uploaded via: twine/6.2.0 CPython/3.10.0

File hashes

Hashes for kairos_asr-0.6.4-py3-none-any.whl
Algorithm Hash digest
SHA256 78b43f8ee28127c1c7535440de5a49ab3269c0e613e1e9d5c3d61106962d3473
MD5 4f46b774fa7a993cb2c77a7a9953c7fb
BLAKE2b-256 e87e2c7c338036e337a0508770138a8616cda794a0076afb4c35040beaf603f9

See more details on using hashes here.

Supported by

AWS Cloud computing and Security Sponsor Datadog Monitoring Depot Continuous Integration Fastly CDN Google Download Analytics Pingdom Monitoring Sentry Error logging StatusPage Status page