Skip to main content

音声ファイルをテキストに変換するCLIツール

Project description

Transcriber Tool

音声ファイル(WAV, MP3など)をテキストに変換するPython製のCLIツールです。

特徴

  • 複数の音声・動画形式に対応(MP3, MP4, WAV, MOV, AVI)
  • faster-whisperを使用した高速な文字起こし
  • 複数のモデルサイズに対応(tiny, base, small, medium, large)
  • シンプルで使いやすいコマンドラインインターフェース

インストール

前提条件

  • Python 3.11以上
  • uv(Pythonパッケージマネージャー)

インストール手順

uv tool install transcriber_tool

もしくは以下のようにuvxコマンドを使えばそのまま実行可能

uvx transcriber_tool
or
uv tool run transcriber_tool

使い方

基本的な使い方

# 基本的な文字起こし
transcriber_tool transcribe audio.mp3

# 出力先を指定
transcriber_tool transcribe audio.mp3 --output result.txt

# モデルサイズを指定
transcriber_tool transcribe audio.mp3 --model-size medium

# 出力ディレクトリを指定
transcriber_tool transcribe audio.mp3 --output-dir ./results

コマンドラインオプション

transcribe [OPTIONS] FILE_PATH

  音声ファイルを文字起こしする

Options:
  -o, --output PATH         出力先のファイルパス(指定がない場合は自動生成)
  -m, --model-size [tiny|base|small|medium|large]
                            使用するモデルサイズ (デフォルト: base)
  -d, --output-dir PATH     出力ディレクトリ(指定がない場合はカレントディレクトリの下に
                            outputディレクトリを作成)
  --help                    ヘルプメッセージを表示

モデルサイズと性能

モデルサイズ メモリ使用量 処理速度 精度
tiny 最速
base 速い
small
medium 遅い
large 最高 最遅 最高

ライセンス

MIT License

Project details


Download files

Download the file for your platform. If you're not sure which to choose, learn more about installing packages.

Source Distribution

transcriber_tool-0.1.1.tar.gz (89.6 kB view details)

Uploaded Source

Built Distribution

If you're not sure about the file name format, learn more about wheel file names.

transcriber_tool-0.1.1-py3-none-any.whl (5.8 kB view details)

Uploaded Python 3

File details

Details for the file transcriber_tool-0.1.1.tar.gz.

File metadata

  • Download URL: transcriber_tool-0.1.1.tar.gz
  • Upload date:
  • Size: 89.6 kB
  • Tags: Source
  • Uploaded using Trusted Publishing? No
  • Uploaded via: uv/0.9.5

File hashes

Hashes for transcriber_tool-0.1.1.tar.gz
Algorithm Hash digest
SHA256 9719d70b61a085f383a8945f84b16e14314f13da64ccf2c8b867d849b6807c4d
MD5 9da34be25d17fb8bf1c2ab806cf90ba7
BLAKE2b-256 ad2a01c7f97ebca02c7c8eb81e7eab5eea7d492cfd3b42f54e6c5b303f7901ff

See more details on using hashes here.

File details

Details for the file transcriber_tool-0.1.1-py3-none-any.whl.

File metadata

File hashes

Hashes for transcriber_tool-0.1.1-py3-none-any.whl
Algorithm Hash digest
SHA256 c4451f3f476cb78a1f3eb049f24068f0d62b0bf08c2934093d4b28d5f98f22e1
MD5 6460adf2b4a6b0efbfd3406b4292ab64
BLAKE2b-256 ecbc7a326989d4fa8b2f0ff4ad9d1e79d1499a7824bdbef6cc4c1956711aef4c

See more details on using hashes here.

Supported by

AWS Cloud computing and Security Sponsor Datadog Monitoring Depot Continuous Integration Fastly CDN Google Download Analytics Pingdom Monitoring Sentry Error logging StatusPage Status page