Skip to main content

MCP Server for transcribing videos via video links and summarizing video content

Project description

MCP Video Digest (视频内容提取总结)

English | 中文

项目简介

MCP Video Digest 是一个视频内容处理服务,,能够从 YouTube、Bilibili、TikTok、Twitter... 视频中提取音频并转换为文本。该服务支持多个转录服务提供商,包括 Deepgram、Gladia、Speechmatics 和 AssemblyAI,可以根据配置的 API 密钥灵活选择使用。(第一个MCP练手的项目,主要熟悉MCP的开发和运行流程)

功能特点

  • 支持超过1000个网站上的流媒体内容下载和音频提取
  • 多个转录服务提供商支持:
    • Deepgram
    • Gladia
    • Speechmatics
    • AssemblyAI
  • 灵活的服务选择机制,根据可用的 API 密钥自动选择服务
  • 异步处理设计,提高并发性能
  • 完整的错误处理和日志记录
  • 支持说话人分离
  • × 支持本地模型cpu/gpu加速处理

目录结构

.
├── src/                    # 源代码目录
│   ├── services/          # 服务实现目录
│   │   ├── download/      # 下载服务
│   │   └── transcription/ # 转录服务
│   ├── main.py           # 主程序逻辑
│   └── __init__.py       # 包初始化文件
├── config/                # 配置文件目录
├── test.py               # 测试脚本
├── run.py                # 服务启动脚本
├── pyproject.toml        # 项目配置和依赖管理
├── uv.lock               # UV 依赖锁定文件
└── .env                  # 环境变量配置

测试截图

YouTube

Bilibili

安装说明

1. 安装 uv 或使用 python

如果还没有安装 uv,可以使用以下命令安装:

curl -LsSf https://astral.sh/uv/install.sh | sh

2. 克隆项目:

git clone https://github.com/R-lz/mcp-video-digest.git
cd mcp-video-digest

3. 创建并激活虚拟环境:

uv venv
source .venv/bin/activate  # Linux/Mac
# 或
.venv\Scripts\activate     # Windows

4. 安装依赖:

uv pip install -e .

speechmatics 在使用requests调试的时候出现了各种问题(不是speechmatics的问题, 是我菜),所以使用了speechmatics sdk

配置说明

  1. 在项目根目录创建 .env 文件或者重命名.env.example,配置所需的 API 密钥:

    mv .env.example .env
    
    # 修改
    DEEPGRAM_API_KEY=your_deepgram_key
    GLADIA_API_KEY=your_gladia_key
    SPEECHMATICS_API_KEY=your_speechmatics_key
    ASSEMBLYAI_API_KEY=your_assemblyai_key
    

    注意:至少需要配置一个服务的 API 密钥

  2. 服务优先级顺序:

    • Deepgram(推荐用于中文内容)
    • Gladia
    • Speechmatics
    • AssemblyAI

使用方法

  1. 启动服务:

    uv run src/main.py
    

    或者使用调试模式:

    UV_DEBUG=1 uv run src/main.py
    
  2. 调用服务:

    from mcp.client import MCPClient
    
    async def process_video():
        client = MCPClient()
        result = await client.call(
            "get_video_content",
            url="https://www.youtube.com/watch?v=video_id"
        )
        print(result)
    
  3. 客户端SSE为示例

{
    "mcpServers": {
      "video_digest": {
        "url": "http://<ip>:8000/sse"
    }
  }
}


# 当然可以在Client传递Key

"env": {
   "DEEPGRAM_API_KEY":"your_deepgram_key"
}

STDIO方式修改启动命令即可:未验证和测试 MCP文档

测试

运行测试脚本:

uv run test.py 
# 或
python test.py

测试脚本会:

  • 验证环境变量配置
  • 测试 YouTube 下载功能
  • 测试各个转录服务
  • 测试完整的视频处理流程

开发指南

  1. 添加新的转录服务:

    • src/services/transcription/ 目录下创建新的服务类
    • 继承 BaseTranscriptionService
    • 实现 transcribe 方法
  2. 自定义下载服务:

    • src/services/download/ 目录下修改或添加新的下载器
    • 继承或修改 YouTubeDownloader

依赖管理

  • 使用 uv pip install package_name 安装新依赖
  • 使用 uv pip freeze > requirements.txt 导出依赖列表
  • 使用 pyproject.toml 管理依赖,uv.lock 锁定依赖版本

错误处理

服务会处理以下情况:

  • API 密钥缺失或无效
  • 视频下载失败
  • 音频转录失败
  • 网络连接问题
  • 服务限制和配额

注意事项

  1. 确保有足够的磁盘空间用于临时文件
  2. 注意各服务提供商的 API 使用限制
  3. 建议使用 Python 3.11 或更高版本
  4. 临时文件会自动清理
  5. 使用 uv 可以获得更快的依赖安装速度和更好的依赖管理
  6. YouTube下载可能需要身份验证,可以复制cookie到根目录下cookies.txt 使用插件快速生成 或者使用cookies-from-browser等其他认证方式, yt-dlp

STT Key申请及免费额度

内容仅供参考

许可证

采用 MIT 许可证。

Project details


Download files

Download the file for your platform. If you're not sure which to choose, learn more about installing packages.

Source Distribution

iflow_mcp_r_lz_mcp_video_digest-0.1.0.tar.gz (9.4 kB view details)

Uploaded Source

Built Distribution

If you're not sure about the file name format, learn more about wheel file names.

iflow_mcp_r_lz_mcp_video_digest-0.1.0-py3-none-any.whl (13.8 kB view details)

Uploaded Python 3

File details

Details for the file iflow_mcp_r_lz_mcp_video_digest-0.1.0.tar.gz.

File metadata

  • Download URL: iflow_mcp_r_lz_mcp_video_digest-0.1.0.tar.gz
  • Upload date:
  • Size: 9.4 kB
  • Tags: Source
  • Uploaded using Trusted Publishing? No
  • Uploaded via: uv/0.9.26 {"installer":{"name":"uv","version":"0.9.26","subcommand":["publish"]},"python":null,"implementation":{"name":null,"version":null},"distro":{"name":"Debian GNU/Linux","version":"13","id":"trixie","libc":null},"system":{"name":null,"release":null},"cpu":null,"openssl_version":null,"setuptools_version":null,"rustc_version":null,"ci":null}

File hashes

Hashes for iflow_mcp_r_lz_mcp_video_digest-0.1.0.tar.gz
Algorithm Hash digest
SHA256 c3ac0b1e716aef2b9b35b07dcd9dafc1b34be2e4cf76a53e5fbba8160b542744
MD5 04841489f9598386b6c8fbac2d625dbb
BLAKE2b-256 fb77b7d6653c4d92a7f648b77588e7b4a6e88d5b2e088d4972b434c5f35efef3

See more details on using hashes here.

File details

Details for the file iflow_mcp_r_lz_mcp_video_digest-0.1.0-py3-none-any.whl.

File metadata

  • Download URL: iflow_mcp_r_lz_mcp_video_digest-0.1.0-py3-none-any.whl
  • Upload date:
  • Size: 13.8 kB
  • Tags: Python 3
  • Uploaded using Trusted Publishing? No
  • Uploaded via: uv/0.9.26 {"installer":{"name":"uv","version":"0.9.26","subcommand":["publish"]},"python":null,"implementation":{"name":null,"version":null},"distro":{"name":"Debian GNU/Linux","version":"13","id":"trixie","libc":null},"system":{"name":null,"release":null},"cpu":null,"openssl_version":null,"setuptools_version":null,"rustc_version":null,"ci":null}

File hashes

Hashes for iflow_mcp_r_lz_mcp_video_digest-0.1.0-py3-none-any.whl
Algorithm Hash digest
SHA256 2dc068b373afc3e9c9930be7c0be5e36f3c61035d69255016bfd1b702883165e
MD5 9997251d8a6f8617a69198c407841112
BLAKE2b-256 60f65be239a899fb16420f8bd4e4add8031b64fb9f90dee28d26ea5fea58ab17

See more details on using hashes here.

Supported by

AWS Cloud computing and Security Sponsor Datadog Monitoring Depot Continuous Integration Fastly CDN Google Download Analytics Pingdom Monitoring Sentry Error logging StatusPage Status page