Skip to main content

A Model Context Protocol server providing VoiceVox text-to-speech functionality for LLMs

Project description

Image

🎙️ VoiceVox MCP サーバー

Python 3.10+ License: MIT Ruff Pytest

GitHub Repo stars GitHub forks GitHub release GitHub tag

VoiceVox を介してテキスト読み上げ機能を提供する Model Context Protocol サーバーです。このサーバーにより、Claude は VoiceVox エンジンが提供する様々な音声を使用してテキストから音声を生成することができます。


🔗 リンク

GitHub Repo stars GitHub forks GitHub release GitHub tag

✨ 機能

  • テキスト読み上げ: 指定したテキストを VoiceVox の音声で読み上げます。
  • 話者選択: 多数の個性的な話者から音声を選択できます。
  • 音声の自動再生: 生成した音声をその場で自動的に再生します。
  • 音声ファイル保存: 生成した音声は sound フォルダに .wav ファイルとして保存されます。

🚀 前提条件

  • VoiceVox エンジンが動作していること(ローカルまたはリモートで)
  • Python 3.10 以上

📦 インストール

uv の使用(推奨)

uv を使用する場合は特別なインストールは必要ありません。直接 uvx を使用して mcp-server-voicevox を実行します。

⚙️ 設定

VoiceVox エンジン

このサーバーは動作するために VoiceVox エンジンが必要です。エンジンの起動は手動で行う必要があります。 デフォルトでは http://localhost:50021 への接続を試みます。--voicevox-url 引数で別の URL を指定することができます。

VoiceVox エンジンは 公式 VoiceVox リポジトリ からダウンロードしてインストールできます。

Claude Desktop 用の設定

Claude Desktop の設定に追加:

uvx を使用する場合
{
  "mcpServers": {
    "voicevox": {
      "command": "uvx",
      "args": ["mcp-server-voicevox", "--voicevox-url=http://localhost:50021"]
    }
  }
}

🛠️ 利用可能なツール

  • get_voices - VoiceVox から利用可能な音声のリストを取得

    • 引数は必要ありません
  • text_to_speech - VoiceVox を使用してテキストを音声に変換

    • 必須引数:
      • text (文字列): 音声に変換するテキスト
    • オプション引数:
      • speaker_id (整数、デフォルト: 1): 使用する音声の ID
      • speed (数値、デフォルト: 1.3): 再生速度の倍率

🎵 特別な機能

  • 生成後の音声は、プラットフォーム固有の方法で自動的に再生されます:
    • Windows: デフォルトのシステムプレーヤーを使用
    • macOS: 内蔵の afplay ユーティリティを使用
    • Linux: まず aplay を試し、失敗した場合は xdg-open にフォールバック

📁 プロジェクト構造

📄 ライセンス

mcp-server-voicevox は MIT ライセンスの下で提供されています。これは、MIT ライセンスの条件に従い、自由に使用、修正、配布することができることを意味します。

🔗 リンク

Project details


Download files

Download the file for your platform. If you're not sure which to choose, learn more about installing packages.

Source Distribution

mcp_server_voicevox-0.2.0.tar.gz (34.2 kB view details)

Uploaded Source

Built Distribution

If you're not sure about the file name format, learn more about wheel file names.

mcp_server_voicevox-0.2.0-py3-none-any.whl (8.1 kB view details)

Uploaded Python 3

File details

Details for the file mcp_server_voicevox-0.2.0.tar.gz.

File metadata

  • Download URL: mcp_server_voicevox-0.2.0.tar.gz
  • Upload date:
  • Size: 34.2 kB
  • Tags: Source
  • Uploaded using Trusted Publishing? Yes
  • Uploaded via: twine/6.1.0 CPython/3.12.9

File hashes

Hashes for mcp_server_voicevox-0.2.0.tar.gz
Algorithm Hash digest
SHA256 32a90993767508c1c459d70acb92a5728ce005ae55c4611a2f36a4e53126e77a
MD5 1c023783ad3bdf921557c2c8b4fdc860
BLAKE2b-256 f094284909c94afe008945201671e4d9b46e0057afbb14af2eb131da76afb53c

See more details on using hashes here.

Provenance

The following attestation bundles were made for mcp_server_voicevox-0.2.0.tar.gz:

Publisher: deploy.yml on Sunwood-ai-labs/mcp-voicevox

Attestations: Values shown here reflect the state when the release was signed and may no longer be current.

File details

Details for the file mcp_server_voicevox-0.2.0-py3-none-any.whl.

File metadata

File hashes

Hashes for mcp_server_voicevox-0.2.0-py3-none-any.whl
Algorithm Hash digest
SHA256 aa00d2687a50220520c0185e47bcc4a83eab1d80fe0fb6b0b868f60df468a288
MD5 e84393a33e777388ab22eb800c91f7c9
BLAKE2b-256 59bfc81ce242abdd7e8a769371a627697f6d892ebcbc77e2fd8b1c2fea857f04

See more details on using hashes here.

Provenance

The following attestation bundles were made for mcp_server_voicevox-0.2.0-py3-none-any.whl:

Publisher: deploy.yml on Sunwood-ai-labs/mcp-voicevox

Attestations: Values shown here reflect the state when the release was signed and may no longer be current.

Supported by

AWS Cloud computing and Security Sponsor Datadog Monitoring Depot Continuous Integration Fastly CDN Google Download Analytics Pingdom Monitoring Sentry Error logging StatusPage Status page