Skip to main content

Инструмент для автоматического создания субтитров для аниме

Project description

AnimeSub

Инструмент для автоматического создания субтитров из видео- или аудиофайлов.
Оптимизирован для японского языка (подходит для аниме, интервью и т.п.).


⚡ Быстрый старт

Локальный файл → субтитры:

animesub -i input_file.mp4

YouTube → субтитры:

animesub -u "https://youtube.com/watch?v=XXXX"

Запуск в Colab Open In Colab


📦 Установка

Из PyPI:

pip install animesub

💡 Для работы на CUDA желательно поставить torch и torchaudio под свою версию CUDA:

pip install torch torchaudio --index-url https://download.pytorch.org/whl/cu126

Не забудьте установить ffmpeg и demucs:

conda install ffmpeg -c conda-forge
pip install demucs

🚀 Использование

Локальный файл

animesub -i input_file.mp4

Создаст input_file.srt в текущей папке.

Скачивание по URL (YouTube и др.)

animesub -u "https://youtube.com/watch?v=XXXX"

Сохранит результат в output.srt.


🔧 Аргументы CLI

Аргумент Описание
-i, --input_file Путь к локальному видео или аудио
-u, --url URL видео/аудио (YouTube)
-o, --output Путь к выходному .srt (по умолчанию: <имя_файла>.srt или output.srt для URL)
-m, --model Модель ASR: tiny, base, small, medium, large, large-v2, large-v3,kotoba-faster, kotoba-whisper, kotoba-whisper-v2.2, kotoba-faster (по умолчанию: small)
-d, --device cpu или cuda (по умолчанию определяется автоматически)
--demucs-model Модель сепарации вокала: htdemucs или mdx_extra_q (по умолчанию: htdemucs)
--merge-silence Максимальная пауза между VAD-сегментами для объединения (по умолчанию: 0.6)

📌 Примеры

CPU + base модель

animesub -i input.mp3 -m base -d cpu

Kotoba-модель с кастомной паузой

animesub -i anime.mkv -m kotoba-whisper-v2.2 --merge-silence 0.8 -d cuda

С YouTube

animesub -u "https://youtube.com/watch?v=XXXX" -m kotoba-faster -d cuda

С указанием файла вывода

animesub -i episode.mp4 -o subs/episode01.srt

🎯 Как работает

  1. Отделение вокала (Demucs)
  2. Детекция речи (Silero VAD)
  3. Транскрипция (Whisper или Kotoba-Whisper)
  4. Пунктуация (XLM-RoBERTa через punctuators)
  5. Экспорт в .srt с форматированием

🛠️ Использование как библиотеки

from AnimeSub.main_logic import process_audio

process_audio(
    input_path="video.mp4",
    output_path="subs.srt",
    model_name="kotoba-whisper-v2.2",
    device="cuda",
    merge_silence=0.6
)

📜 Лицензия

MIT


👤 Автор

Ivan Tyumentsev 📧 ivanfufa184@gmail.com 🔗 GitHub

Project details


Download files

Download the file for your platform. If you're not sure which to choose, learn more about installing packages.

Source Distribution

animesub-1.0.3.tar.gz (22.7 kB view details)

Uploaded Source

Built Distribution

If you're not sure about the file name format, learn more about wheel file names.

animesub-1.0.3-py3-none-any.whl (27.8 kB view details)

Uploaded Python 3

File details

Details for the file animesub-1.0.3.tar.gz.

File metadata

  • Download URL: animesub-1.0.3.tar.gz
  • Upload date:
  • Size: 22.7 kB
  • Tags: Source
  • Uploaded using Trusted Publishing? No
  • Uploaded via: twine/6.1.0 CPython/3.10.18

File hashes

Hashes for animesub-1.0.3.tar.gz
Algorithm Hash digest
SHA256 6ce763db1dc83517b5f476c21516cd2c406df002e93b212f27375f9672a4c5bb
MD5 baefe29ec49e7718943cef4391bf6703
BLAKE2b-256 23507558cb2c092111024b580f13f8c27f60a6ba7ca688eae20b9b195824601b

See more details on using hashes here.

File details

Details for the file animesub-1.0.3-py3-none-any.whl.

File metadata

  • Download URL: animesub-1.0.3-py3-none-any.whl
  • Upload date:
  • Size: 27.8 kB
  • Tags: Python 3
  • Uploaded using Trusted Publishing? No
  • Uploaded via: twine/6.1.0 CPython/3.10.18

File hashes

Hashes for animesub-1.0.3-py3-none-any.whl
Algorithm Hash digest
SHA256 c14f3f1911afd4e1d16a8fa2247ba69b1ebaee4a7f5a26caab5d3ba25b35fac9
MD5 112b41cb3ff284d162917731994f34c7
BLAKE2b-256 38f2fd5bc4dd5e5d895fccb0d275e1cf43d4a2f124f9cb5c22cbc94050f13ea1

See more details on using hashes here.

Supported by

AWS Cloud computing and Security Sponsor Datadog Monitoring Depot Continuous Integration Fastly CDN Google Download Analytics Pingdom Monitoring Sentry Error logging StatusPage Status page