Skip to main content

Инструмент для автоматического создания субтитров для аниме

Project description

AnimeSub

Инструмент для автоматического создания субтитров из видео- или аудиофайлов.
Оптимизирован для японского языка (подходит для аниме, интервью и т.п.).


⚡ Быстрый старт

Локальный файл → субтитры:

animesub -i input_file.mp4

YouTube → субтитры:

animesub -u "https://youtube.com/watch?v=XXXX"

Запуск в Colab Open In Colab


📦 Установка

Из PyPI:

pip install animesub

💡 Для работы на CUDA желательно поставить torch и torchaudio под свою версию CUDA:

pip install torch torchaudio --index-url https://download.pytorch.org/whl/cu126

Не забудьте установить ffmpeg и demucs:

conda install ffmpeg -c conda-forge
pip install demucs

🚀 Использование

Локальный файл

animesub -i input_file.mp4

Создаст input_file.srt в текущей папке.

Скачивание по URL (YouTube и др.)

animesub -u "https://youtube.com/watch?v=XXXX"

Сохранит результат в output.srt.


🔧 Аргументы CLI

Аргумент Описание
-i, --input_file Путь к локальному видео или аудио
-u, --url URL видео/аудио (YouTube)
-o, --output Путь к выходному .srt (по умолчанию: <имя_файла>.srt или output.srt для URL)
-m, --model Модель ASR: tiny, base, small, medium, large, large-v2, large-v3,kotoba-faster, kotoba-whisper, kotoba-whisper-v2.2, kotoba-faster (по умолчанию: small)
-d, --device cpu или cuda (по умолчанию определяется автоматически)
--demucs-model Модель сепарации вокала: htdemucs или mdx_extra_q (по умолчанию: htdemucs)
--merge-silence Максимальная пауза между VAD-сегментами для объединения (по умолчанию: 0.6)

📌 Примеры

CPU + base модель

animesub -i input.mp3 -m base -d cpu

Kotoba-модель с кастомной паузой

animesub -i anime.mkv -m kotoba-whisper-v2.2 --merge-silence 0.8 -d cuda

С YouTube

animesub -u "https://youtube.com/watch?v=XXXX" -m kotoba-faster -d cuda

С указанием файла вывода

animesub -i episode.mp4 -o subs/episode01.srt

🎯 Как работает

  1. Отделение вокала (Demucs)
  2. Детекция речи (Silero VAD)
  3. Транскрипция (Whisper или Kotoba-Whisper)
  4. Пунктуация (XLM-RoBERTa через punctuators)
  5. Экспорт в .srt с форматированием

🛠️ Использование как библиотеки

from AnimeSub.main_logic import process_audio

process_audio(
    input_path="video.mp4",
    output_path="subs.srt",
    model_name="kotoba-whisper-v2.2",
    device="cuda",
    merge_silence=0.6
)

📜 Лицензия

MIT


👤 Автор

Ivan Tyumentsev 📧 ivanfufa184@gmail.com 🔗 GitHub

Project details


Download files

Download the file for your platform. If you're not sure which to choose, learn more about installing packages.

Source Distribution

animesub-1.0.2.tar.gz (22.1 kB view details)

Uploaded Source

Built Distribution

If you're not sure about the file name format, learn more about wheel file names.

animesub-1.0.2-py3-none-any.whl (28.0 kB view details)

Uploaded Python 3

File details

Details for the file animesub-1.0.2.tar.gz.

File metadata

  • Download URL: animesub-1.0.2.tar.gz
  • Upload date:
  • Size: 22.1 kB
  • Tags: Source
  • Uploaded using Trusted Publishing? No
  • Uploaded via: twine/6.1.0 CPython/3.10.18

File hashes

Hashes for animesub-1.0.2.tar.gz
Algorithm Hash digest
SHA256 e47efcd06642b412f84bef724a883e9a306580c16b4c935e4444a154883047d8
MD5 db02fffc379d16f388bd80ae69808394
BLAKE2b-256 37a7f7ac1a7c258c489f347332fb9c717850c2237f430127ecda987f550be420

See more details on using hashes here.

File details

Details for the file animesub-1.0.2-py3-none-any.whl.

File metadata

  • Download URL: animesub-1.0.2-py3-none-any.whl
  • Upload date:
  • Size: 28.0 kB
  • Tags: Python 3
  • Uploaded using Trusted Publishing? No
  • Uploaded via: twine/6.1.0 CPython/3.10.18

File hashes

Hashes for animesub-1.0.2-py3-none-any.whl
Algorithm Hash digest
SHA256 0027ddab1f609ecb9ba790e9692ab4af191deb89d3632fcf130bb77b882e4b00
MD5 ebc22a07ac95f8efbaad4ba6b9e4d16e
BLAKE2b-256 d16415a26fb856510b9356ddf1dd4e158163a8f414176a9177fdb151e8440008

See more details on using hashes here.

Supported by

AWS Cloud computing and Security Sponsor Datadog Monitoring Depot Continuous Integration Fastly CDN Google Download Analytics Pingdom Monitoring Sentry Error logging StatusPage Status page