Skip to main content

音声ファイルをテキストに変換するCLIツール

Project description

Transcriber Tool

音声ファイル(WAV, MP3など)をテキストに変換するPython製のCLIツールです。

特徴

  • 複数の音声・動画形式に対応(MP3, MP4, WAV, MOV, AVI)
  • faster-whisperを使用した高速な文字起こし
  • 複数のモデルサイズに対応(tiny, base, small, medium, large)
  • シンプルで使いやすいコマンドラインインターフェース

インストール

前提条件

  • Python 3.11以上
  • uv(Pythonパッケージマネージャー)

インストール手順

# リポジトリをクローン
git clone https://github.com/karaage0703/transcriber_tool.git
cd transcriber_tool

# uvを使ってインストール
uv pip install -e .

または、直接インストールする場合:

uv pip install git+https://github.com/karaage070/transcriber_tool.git

使い方

基本的な使い方

# 基本的な文字起こし
transcriber_tool transcribe audio.mp3

# 出力先を指定
transcriber_tool transcribe audio.mp3 --output result.txt

# モデルサイズを指定
transcriber_tool transcribe audio.mp3 --model-size medium

# 出力ディレクトリを指定
transcriber_tool transcribe audio.mp3 --output-dir ./results

コマンドラインオプション

transcribe [OPTIONS] FILE_PATH

  音声ファイルを文字起こしする

Options:
  -o, --output PATH         出力先のファイルパス(指定がない場合は自動生成)
  -m, --model-size [tiny|base|small|medium|large]
                            使用するモデルサイズ (デフォルト: base)
  -d, --output-dir PATH     出力ディレクトリ(指定がない場合はカレントディレクトリの下に
                            outputディレクトリを作成)
  --help                    ヘルプメッセージを表示

モデルサイズと性能

モデルサイズ メモリ使用量 処理速度 精度
tiny 最速
base 速い
small
medium 遅い
large 最高 最遅 最高

開発

# 開発用インストール
uv pip install -e ".[dev]"

# テスト実行
pytest

ライセンス

MIT License

Project details


Download files

Download the file for your platform. If you're not sure which to choose, learn more about installing packages.

Source Distribution

transcriber_tool-0.1.0.tar.gz (91.4 kB view details)

Uploaded Source

Built Distribution

If you're not sure about the file name format, learn more about wheel file names.

transcriber_tool-0.1.0-py3-none-any.whl (5.7 kB view details)

Uploaded Python 3

File details

Details for the file transcriber_tool-0.1.0.tar.gz.

File metadata

  • Download URL: transcriber_tool-0.1.0.tar.gz
  • Upload date:
  • Size: 91.4 kB
  • Tags: Source
  • Uploaded using Trusted Publishing? No
  • Uploaded via: twine/6.1.0 CPython/3.12.9

File hashes

Hashes for transcriber_tool-0.1.0.tar.gz
Algorithm Hash digest
SHA256 f0183359c27e77915e8ac9c36f86e4aa31634e36d1a7dd4c920c93a0d489850b
MD5 7d9f80fe954f57931b93a3bc6c2b8ddd
BLAKE2b-256 6acd08c1598bba92b658e450b216ae86ffc8b3990edbf7102f2dda30198bac7d

See more details on using hashes here.

File details

Details for the file transcriber_tool-0.1.0-py3-none-any.whl.

File metadata

File hashes

Hashes for transcriber_tool-0.1.0-py3-none-any.whl
Algorithm Hash digest
SHA256 392d796dfcde828a99531686ac6109615d2ff06bc82bcb246768de019ac85c46
MD5 7c8476ef31dd0128c065f7337c8120e9
BLAKE2b-256 1fd877a33456cb59ae8da4afe436c242037859d320eca1101b141460c4da1add

See more details on using hashes here.

Supported by

AWS Cloud computing and Security Sponsor Datadog Monitoring Depot Continuous Integration Fastly CDN Google Download Analytics Pingdom Monitoring Sentry Error logging StatusPage Status page