音声ファイルをテキストに変換するCLIツール
Project description
Transcriber Tool
音声ファイル(WAV, MP3など)をテキストに変換するPython製のCLIツールです。
特徴
- 複数の音声・動画形式に対応(MP3, MP4, WAV, MOV, AVI)
- faster-whisperを使用した高速な文字起こし
- 複数のモデルサイズに対応(tiny, base, small, medium, large)
- シンプルで使いやすいコマンドラインインターフェース
インストール
前提条件
- Python 3.11以上
- uv(Pythonパッケージマネージャー)
インストール手順
# リポジトリをクローン
git clone https://github.com/karaage0703/transcriber_tool.git
cd transcriber_tool
# uvを使ってインストール
uv pip install -e .
または、直接インストールする場合:
uv pip install git+https://github.com/karaage070/transcriber_tool.git
使い方
基本的な使い方
# 基本的な文字起こし
transcriber_tool transcribe audio.mp3
# 出力先を指定
transcriber_tool transcribe audio.mp3 --output result.txt
# モデルサイズを指定
transcriber_tool transcribe audio.mp3 --model-size medium
# 出力ディレクトリを指定
transcriber_tool transcribe audio.mp3 --output-dir ./results
コマンドラインオプション
transcribe [OPTIONS] FILE_PATH
音声ファイルを文字起こしする
Options:
-o, --output PATH 出力先のファイルパス(指定がない場合は自動生成)
-m, --model-size [tiny|base|small|medium|large]
使用するモデルサイズ (デフォルト: base)
-d, --output-dir PATH 出力ディレクトリ(指定がない場合はカレントディレクトリの下に
outputディレクトリを作成)
--help ヘルプメッセージを表示
モデルサイズと性能
| モデルサイズ | メモリ使用量 | 処理速度 | 精度 |
|---|---|---|---|
| tiny | 低 | 最速 | 低 |
| base | 低 | 速い | 中 |
| small | 中 | 中 | 中 |
| medium | 高 | 遅い | 高 |
| large | 最高 | 最遅 | 最高 |
開発
# 開発用インストール
uv pip install -e ".[dev]"
# テスト実行
pytest
ライセンス
Project details
Download files
Download the file for your platform. If you're not sure which to choose, learn more about installing packages.
Source Distribution
transcriber_tool-0.1.0.tar.gz
(91.4 kB
view details)
Built Distribution
Filter files by name, interpreter, ABI, and platform.
If you're not sure about the file name format, learn more about wheel file names.
Copy a direct link to the current filters
File details
Details for the file transcriber_tool-0.1.0.tar.gz.
File metadata
- Download URL: transcriber_tool-0.1.0.tar.gz
- Upload date:
- Size: 91.4 kB
- Tags: Source
- Uploaded using Trusted Publishing? No
- Uploaded via: twine/6.1.0 CPython/3.12.9
File hashes
| Algorithm | Hash digest | |
|---|---|---|
| SHA256 |
f0183359c27e77915e8ac9c36f86e4aa31634e36d1a7dd4c920c93a0d489850b
|
|
| MD5 |
7d9f80fe954f57931b93a3bc6c2b8ddd
|
|
| BLAKE2b-256 |
6acd08c1598bba92b658e450b216ae86ffc8b3990edbf7102f2dda30198bac7d
|
File details
Details for the file transcriber_tool-0.1.0-py3-none-any.whl.
File metadata
- Download URL: transcriber_tool-0.1.0-py3-none-any.whl
- Upload date:
- Size: 5.7 kB
- Tags: Python 3
- Uploaded using Trusted Publishing? No
- Uploaded via: twine/6.1.0 CPython/3.12.9
File hashes
| Algorithm | Hash digest | |
|---|---|---|
| SHA256 |
392d796dfcde828a99531686ac6109615d2ff06bc82bcb246768de019ac85c46
|
|
| MD5 |
7c8476ef31dd0128c065f7337c8120e9
|
|
| BLAKE2b-256 |
1fd877a33456cb59ae8da4afe436c242037859d320eca1101b141460c4da1add
|