Skip to main content

High-performance Russian speech recognition library based on GigaAM-style RNN-T and ONNX.

Project description

Kairos Automatic Speech Recognition

📄 Описание

Kairos ASR — высокопроизводительная библиотека распознавания русской речи на базе GigaAM-style RNN-T и ONNX. Фокус: скорость, точность и простая интеграция в микросервисы и десктопы.

Основные возможности:

  • Оптимизированный ONNX-инференс
  • CPU, GPU (CUDA, extra [gpu]) и Metal (MPS, extra [metal])
  • Временные метки (word-level, sentence-level)
  • Итеративная обработка с прогрессом и ETA
  • Встроенный Voice-Activity-Detection (VAD)
  • Поддержка длинных аудио
  • Поддержка Windows, Linux и macOS

⚡ Быстрый старт

pip install kairos-asr[cpu]
# для GPU (Windows/Linux): pip install kairos-asr[gpu]
# для macOS (Metal/MPS): pip install kairos-asr[metal]

Если нужна конкретная сборка Torch под вашу CUDA:

# пример под CUDA 12.1/12.2 (cu121)
pip install torch==2.5.1 torchaudio==2.5.1 --index-url https://download.pytorch.org/whl/cu121 --upgrade

🚀 Использование (Python)

Минимальный пример:

from kairos_asr import KairosASR

asr = KairosASR()  # авто-загрузка весов с HF
result = asr.transcribe(wav_file="audio.wav")
print(result.full_text)

Требования к аудио:

  • Любые форматы, поддерживаемые ffmpeg; ресемплинг до 16 kHz.
  • WAV PCM 16-bit mono (рекомендуется); стерео приводится к моно.
  • Длинные записи режутся Silero VAD на ~15–25 c (жёсткий лимит ~30 c) и объединяются.

🖥️ Использование (CLI)

Установите пакет, затем:

# Проверить окружение
kairos-asr doctor

# Список локальных/доступных моделей
kairos-asr list

# Скачать все модели заранее
kairos-asr download

# Перевести файл в текст
kairos-asr transcribe <wav_file>

⚙️ Системные требования

  • ffmpeg должен быть доступен в PATH (загрузка и ресемплинг аудио).
  • Доступ в интернет. При первом запуске скачиваются веса моделей. Для ускорения и избежания лимитов задайте HF_TOKEN (huggingface-cli login или экспорт переменной окружения).

Project details


Download files

Download the file for your platform. If you're not sure which to choose, learn more about installing packages.

Source Distribution

kairos_asr-0.7.0.tar.gz (29.5 kB view details)

Uploaded Source

Built Distribution

If you're not sure about the file name format, learn more about wheel file names.

kairos_asr-0.7.0-py3-none-any.whl (29.0 kB view details)

Uploaded Python 3

File details

Details for the file kairos_asr-0.7.0.tar.gz.

File metadata

  • Download URL: kairos_asr-0.7.0.tar.gz
  • Upload date:
  • Size: 29.5 kB
  • Tags: Source
  • Uploaded using Trusted Publishing? No
  • Uploaded via: twine/6.2.0 CPython/3.10.19

File hashes

Hashes for kairos_asr-0.7.0.tar.gz
Algorithm Hash digest
SHA256 5225e9edd60dd9eac3e42ba218fcf4218ab3d44a8393aa13e51e8eff82d7bd9a
MD5 e3e16828bee19e069f925d70a8618263
BLAKE2b-256 c49b44e0c61bc7a796e10ae88cc86c24bb230b71d0b2fb34b48ae335857e8a7b

See more details on using hashes here.

File details

Details for the file kairos_asr-0.7.0-py3-none-any.whl.

File metadata

  • Download URL: kairos_asr-0.7.0-py3-none-any.whl
  • Upload date:
  • Size: 29.0 kB
  • Tags: Python 3
  • Uploaded using Trusted Publishing? No
  • Uploaded via: twine/6.2.0 CPython/3.10.19

File hashes

Hashes for kairos_asr-0.7.0-py3-none-any.whl
Algorithm Hash digest
SHA256 8bc821e48713316f6118e2004a4202c2a1ec9ed7a53b6194a777d2d49fedd8f5
MD5 c93686a4c7e18747e0553fe56b402403
BLAKE2b-256 f03cd86875cc9d8827cced8a4bc448927bf7cbd6d9f2f314cee162e65bc33e82

See more details on using hashes here.

Supported by

AWS Cloud computing and Security Sponsor Datadog Monitoring Depot Continuous Integration Fastly CDN Google Download Analytics Pingdom Monitoring Sentry Error logging StatusPage Status page