Skip to main content

音声ファイルをテキストに変換するCLIツール

Project description

Transcriber Tool

音声ファイル(WAV, MP3など)をテキストに変換するPython製のCLIツールです。

特徴

  • 複数の音声・動画形式に対応(MP3, MP4, WAV, MOV, AVI)
  • faster-whisperを使用した高速な文字起こし
  • 複数のモデルサイズに対応(tiny, base, small, medium, large)
  • シンプルで使いやすいコマンドラインインターフェース

インストール

前提条件

  • Python 3.11以上
  • uv(Pythonパッケージマネージャー)

インストール手順

uv tool install transcriber_tool

もしくは以下のようにuvxコマンドを使えばそのまま実行可能

uvx transcriber_tool
or
uv tool run transcriber_tool

使い方

基本的な使い方

# 基本的な文字起こし
transcriber_tool transcribe audio.mp3

# 出力先を指定
transcriber_tool transcribe audio.mp3 --output result.txt

# モデルサイズを指定
transcriber_tool transcribe audio.mp3 --model-size medium

# 出力ディレクトリを指定
transcriber_tool transcribe audio.mp3 --output-dir ./results

コマンドラインオプション

transcribe [OPTIONS] FILE_PATH

  音声ファイルを文字起こしする

Options:
  -o, --output PATH         出力先のファイルパス(指定がない場合は自動生成)
  -m, --model-size [tiny|base|small|medium|large]
                            使用するモデルサイズ (デフォルト: base)
  -d, --output-dir PATH     出力ディレクトリ(指定がない場合はカレントディレクトリの下に
                            outputディレクトリを作成)
  --help                    ヘルプメッセージを表示

モデルサイズと性能

モデルサイズ メモリ使用量 処理速度 精度
tiny 最速
base 速い
small
medium 遅い
large 最高 最遅 最高

ライセンス

MIT License

Project details


Download files

Download the file for your platform. If you're not sure which to choose, learn more about installing packages.

Source Distribution

transcriber_tool-0.2.0.tar.gz (93.8 kB view details)

Uploaded Source

Built Distribution

If you're not sure about the file name format, learn more about wheel file names.

transcriber_tool-0.2.0-py3-none-any.whl (6.7 kB view details)

Uploaded Python 3

File details

Details for the file transcriber_tool-0.2.0.tar.gz.

File metadata

  • Download URL: transcriber_tool-0.2.0.tar.gz
  • Upload date:
  • Size: 93.8 kB
  • Tags: Source
  • Uploaded using Trusted Publishing? No
  • Uploaded via: uv/0.9.2

File hashes

Hashes for transcriber_tool-0.2.0.tar.gz
Algorithm Hash digest
SHA256 44d1b9663516aa120e35cb231cd5cf7e3903c0bd7a08139347e866ecef69a5c6
MD5 fa886f581b8b6e506f75634fb9f7f353
BLAKE2b-256 7580c9db8dc6a8edc2d2b222387f1f470fb9e276810f97d27e8c6fb8dfd0151c

See more details on using hashes here.

File details

Details for the file transcriber_tool-0.2.0-py3-none-any.whl.

File metadata

File hashes

Hashes for transcriber_tool-0.2.0-py3-none-any.whl
Algorithm Hash digest
SHA256 575a56ea82ebfa42af4a4961b69b4b8d766fd18a30c842f7bd7ab43a4f2ee970
MD5 f8ebfe251df09062d4476b9765206faf
BLAKE2b-256 bdf45ef141723d6ddc45fa0f83beebc98b8fa3377afbe2861b2862789f498605

See more details on using hashes here.

Supported by

AWS Cloud computing and Security Sponsor Datadog Monitoring Depot Continuous Integration Fastly CDN Google Download Analytics Pingdom Monitoring Sentry Error logging StatusPage Status page