Skip to main content

Инструмент для автоматического создания субтитров для аниме

Project description

AnimeSub

Инструмент для автоматического создания субтитров из видео- или аудиофайлов.
Оптимизирован для японского языка (подходит для аниме, интервью и т.п.).


⚡ Быстрый старт

Локальный файл → субтитры:

animesub -i input_file.mp4

YouTube → субтитры:

animesub -u "https://youtube.com/watch?v=XXXX"

Запуск в Colab Open In Colab


📦 Установка

Из PyPI:

pip install animesub

💡 Для работы на CUDA желательно поставить torch и torchaudio под свою версию CUDA:

pip install torch torchaudio --index-url https://download.pytorch.org/whl/cu126

Не забудьте установить ffmpeg и demucs:

conda install ffmpeg -c conda-forge
pip install demucs

🚀 Использование

Локальный файл

animesub -i input_file.mp4

Создаст input_file.srt в текущей папке.

Скачивание по URL (YouTube и др.)

animesub -u "https://youtube.com/watch?v=XXXX"

Сохранит результат в output.srt.


🔧 Аргументы CLI

Аргумент Описание
-i, --input_file Путь к локальному видео или аудио
-u, --url URL видео/аудио (YouTube)
-o, --output Путь к выходному .srt (по умолчанию: <имя_файла>.srt или output.srt для URL)
-m, --model Модель ASR: tiny, base, small, medium, large, large-v2, large-v3,kotoba-faster, kotoba-whisper, kotoba-whisper-v2.2, kotoba-faster (по умолчанию: small)
-d, --device cpu или cuda (по умолчанию определяется автоматически)
--demucs-model Модель сепарации вокала: htdemucs или mdx_extra_q (по умолчанию: htdemucs)
--merge-silence Максимальная пауза между VAD-сегментами для объединения (по умолчанию: 0.6)

📌 Примеры

CPU + base модель

animesub -i input.mp3 -m base -d cpu

Kotoba-модель с кастомной паузой

animesub -i anime.mkv -m kotoba-whisper-v2.2 --merge-silence 0.8 -d cuda

С YouTube

animesub -u "https://youtube.com/watch?v=XXXX" -m kotoba-faster -d cuda

С указанием файла вывода

animesub -i episode.mp4 -o subs/episode01.srt

🎯 Как работает

  1. Отделение вокала (Demucs)
  2. Детекция речи (Silero VAD)
  3. Транскрипция (Whisper или Kotoba-Whisper)
  4. Пунктуация (XLM-RoBERTa через punctuators)
  5. Экспорт в .srt с форматированием

🛠️ Использование как библиотеки

from AnimeSub.main_logic import process_audio

process_audio(
    input_path="video.mp4",
    output_path="subs.srt",
    model_name="kotoba-whisper-v2.2",
    device="cuda",
    merge_silence=0.6
)

📜 Лицензия

MIT


👤 Автор

Ivan Tyumentsev 📧 ivanfufa184@gmail.com 🔗 GitHub

Project details


Download files

Download the file for your platform. If you're not sure which to choose, learn more about installing packages.

Source Distribution

animesub-1.0.1.tar.gz (22.1 kB view details)

Uploaded Source

Built Distribution

If you're not sure about the file name format, learn more about wheel file names.

animesub-1.0.1-py3-none-any.whl (28.0 kB view details)

Uploaded Python 3

File details

Details for the file animesub-1.0.1.tar.gz.

File metadata

  • Download URL: animesub-1.0.1.tar.gz
  • Upload date:
  • Size: 22.1 kB
  • Tags: Source
  • Uploaded using Trusted Publishing? No
  • Uploaded via: twine/6.1.0 CPython/3.10.18

File hashes

Hashes for animesub-1.0.1.tar.gz
Algorithm Hash digest
SHA256 731d12670afa158abb75f805caa95eb736264f0b3bb33c5dd843e9d58a00e6d2
MD5 e037bf402e8a9b88546efaeb86566246
BLAKE2b-256 462ea5c04519b66d85c8031a35740cc5e523e4864816578ee3cfdc1e209ab7fe

See more details on using hashes here.

File details

Details for the file animesub-1.0.1-py3-none-any.whl.

File metadata

  • Download URL: animesub-1.0.1-py3-none-any.whl
  • Upload date:
  • Size: 28.0 kB
  • Tags: Python 3
  • Uploaded using Trusted Publishing? No
  • Uploaded via: twine/6.1.0 CPython/3.10.18

File hashes

Hashes for animesub-1.0.1-py3-none-any.whl
Algorithm Hash digest
SHA256 a56be21895c4f90f6e88f6ed36d4e16f2b460b9f700cf9625596a936935a5828
MD5 370f3936c3dd899566064afaac48f009
BLAKE2b-256 8f7cd316bfe3dc81e7f58822971702bddf449669c1479c86f79f872c62bff6fa

See more details on using hashes here.

Supported by

AWS Cloud computing and Security Sponsor Datadog Monitoring Depot Continuous Integration Fastly CDN Google Download Analytics Pingdom Monitoring Sentry Error logging StatusPage Status page