High-performance Russian speech recognition library based on GigaAM-style RNN-T and ONNX.
Project description
Kairos Automatic Speech Recognition
📄 Описание
Kairos ASR — высокопроизводительная библиотека распознавания русской речи на базе GigaAM-style RNN-T и ONNX. Фокус: скорость, точность и простая интеграция в микросервисы и десктопы.
Основные возможности:
- Оптимизированный ONNX-инференс
- CPU и GPU (CUDA, extra
[gpu]) - Временные метки (word-level, sentence-level)
- Итеративная обработка с прогрессом и ETA
- Встроенный Voice-Activity-Detection (VAD)
- Поддержка длинных аудио
- Поддержка Windows и Linux
⚡ Быстрый старт
pip install kairos-asr[cpu]
# для GPU: pip install kairos-asr[gpu]
Если нужна конкретная сборка Torch под вашу CUDA:
# пример под CUDA 12.1/12.2 (cu121)
pip install torch==2.5.1 torchaudio==2.5.1 --index-url https://download.pytorch.org/whl/cu121 --upgrade
🚀 Использование (Python)
Минимальный пример:
from kairos_asr import KairosASR
asr = KairosASR() # авто-загрузка весов с HF
result = asr.transcribe(wav_file="audio.wav")
print(result.full_text)
Требования к аудио:
- Любые форматы, поддерживаемые
ffmpeg; ресемплинг до 16 kHz. - WAV PCM 16-bit mono (рекомендуется); стерео приводится к моно.
- Длинные записи режутся Silero VAD на ~15–25 c (жёсткий лимит ~30 c) и объединяются.
🖥️ Использование (CLI)
Установите пакет, затем:
# Проверить окружение
kairos-asr doctor
# Список локальных/доступных моделей
kairos-asr list
# Скачать все модели заранее
kairos-asr download
# Перевести файл в текст
kairos-asr transcribe <wav_file>
⚙️ Системные требования
ffmpegдолжен быть доступен вPATH(загрузка и ресемплинг аудио).- Доступ в интернет при первом запуске: скачивание весов моделей. Для ускорения и избежания лимитов задайте
HF_TOKEN(huggingface-cli loginили экспорт переменной окружения).
Project details
Download files
Download the file for your platform. If you're not sure which to choose, learn more about installing packages.
Source Distribution
Built Distribution
Filter files by name, interpreter, ABI, and platform.
If you're not sure about the file name format, learn more about wheel file names.
Copy a direct link to the current filters
File details
Details for the file kairos_asr-0.6.6.tar.gz.
File metadata
- Download URL: kairos_asr-0.6.6.tar.gz
- Upload date:
- Size: 24.3 kB
- Tags: Source
- Uploaded using Trusted Publishing? No
- Uploaded via: twine/5.1.1 CPython/3.10.19
File hashes
| Algorithm | Hash digest | |
|---|---|---|
| SHA256 |
104d73028dad88cae91d9c525a2c095ed03d86b4c0d12e2b9b7c93d83b0bfd45
|
|
| MD5 |
0e00309f9f1fdce3427557d82739e027
|
|
| BLAKE2b-256 |
5fb0e4bf4732ed5a4d94c4c311b6bf37025ad5c672f1fa14f072f786ad77f8d2
|
File details
Details for the file kairos_asr-0.6.6-py3-none-any.whl.
File metadata
- Download URL: kairos_asr-0.6.6-py3-none-any.whl
- Upload date:
- Size: 24.8 kB
- Tags: Python 3
- Uploaded using Trusted Publishing? No
- Uploaded via: twine/5.1.1 CPython/3.10.19
File hashes
| Algorithm | Hash digest | |
|---|---|---|
| SHA256 |
7427b7e86a379dacb697e4bfdf8424b36775ad08d3f1d56b3c330f933746b1bb
|
|
| MD5 |
8696242a3068c483e94ad775db975329
|
|
| BLAKE2b-256 |
54f62a33d22b89bc7a9fb7f2b4a43d0d00e32877d77490a1d63219ba7dbfc627
|