A Model Context Protocol server for media processing with AI tools

These details have not been verified by PyPI

Project description

Media Agent MCP

一个基于 Model Context Protocol (MCP) 的媒体处理服务器，提供强大的AI驱动的媒体处理工具。

🚀 功能特性

核心工具 (9个)

TOS存储 - 将内容保存为URL
视频拼接 - 拼接多个视频文件
视频帧提取 - 提取视频的最后一帧
Seedream图像生成 - 使用AI模型生成图像
Seedance视频生成 - 使用AI模型生成视频（支持lite和pro版本）
Seededit角色维持 - 保持主要角色的一致性
Seed1.6视觉语言模型 - 执行视觉任务工作流
图像选择器 - 从多个图像中选择最佳的一个
视频选择器 - 从多个视频中选择最佳的一个

AI模型支持

Seedream: 高质量图像生成
Seedance: 视频生成（支持文本生成视频、首帧生成视频、首尾帧生成视频）
Seededit: 图像编辑和角色一致性维护
Seed1.6: 多模态视觉语言理解

📋 系统要求

Python >= 3.12
支持的操作系统：macOS, Linux, Windows

🛠️ 安装

方法一：使用 UVX（推荐）

uvx media-agent-mcp

方法二：本地开发安装

1. 克隆仓库

git clone <repository-url>
cd media-agent-mcp

2. 安装依赖

使用 uv（推荐）：

uv sync

或使用 pip：

pip install -e .

3. 配置环境变量

复制环境变量模板并填写配置：

cp .env.template .env

编辑 .env 文件，填写以下必要配置：

# TOS存储配置
TOS_ACCESS_KEY=your_tos_access_key_here
TOS_SECRET_KEY=your_tos_secret_key_here
TOS_BUCKET_NAME=your_bucket_name_here
TOS_ENDPOINT=tos-ap-southeast-1.bytepluses.com
TOS_REGION=ap-southeast-1

# 火山引擎视觉智能SDK配置
VOLC_ACCESS_KEY=your_volcengine_access_key_here
VOLC_SECRET_KEY=your_volcengine_secret_key_here

# BytePlus ModelArk API配置
ARK_API_KEY=your_ark_api_key_here
ARK_BASE_URL=https://ark.ap-southeast.bytepluses.com

# AI模型端点配置
SEEDANCE_EP=seedance-1-0-lite
SEEDREAM_EP=seedream-1-0
SEEDEDIT_EP=seededit-3-0
VLM_EP=seed-1-6-chat

🚀 使用方法

启动MCP服务器

使用 UVX

uvx media-agent-mcp

使用 UV（本地开发）

uv run media-agent-mcp

使用stdio传输（默认）

media-agent-mcp

使用SSE传输

media-agent-mcp --transport sse --host 127.0.0.1 --port 8000

直接运行服务器文件

cd src
python -m media_agent_mcp.server

命令行选项

media-agent-mcp --help

可用选项：

--transport: 传输方式 (sse 或 stdio，默认: stdio)
--host: SSE传输的主机地址 (默认: 127.0.0.1)
--port: SSE传输的端口 (默认: 8000)
--version: 显示版本信息

与MCP客户端集成

Claude Desktop配置

在Claude Desktop的配置文件中添加：

{
  "mcpServers": {
    "media-agent": {
      "command": "uvx",
      "args": ["media-agent-mcp"]
    }
  }
}

VS Code MCP扩展配置

{
  "mcp.servers": {
    "media-agent": {
      "command": "uvx",
      "args": ["media-agent-mcp"]
    }
  }
}

🔧 API工具详细说明

1. 视频拼接工具

video_concat_tool(video_urls: list[str]) -> str

拼接多个视频URL并上传到TOS。

参数：

video_urls: 要按顺序拼接的视频URL列表

返回： JSON字符串，包含状态、数据和消息

示例：

result = video_concat_tool([
    "https://example.com/video1.mp4",
    "https://example.com/video2.mp4"
])

2. 视频帧提取工具

video_last_frame_tool(video_path: str) -> str

从视频文件中提取最后一帧并上传到TOS。

参数：

video_path: 视频文件路径或URL

返回： JSON字符串，包含状态、数据和消息

3. Seedream图像生成工具

seedream_generate_image_tool(
    prompt: str, 
    style: str = "realistic", 
    size: str = "1024x1024"
) -> str

使用Seedream AI模型生成图像。

参数：

prompt: 图像描述文本
style: 图像风格（realistic, artistic, cartoon等）
size: 图像尺寸（如"1024x1024"）

示例：

result = seedream_generate_image_tool(
    prompt="一只可爱的小猫坐在花园里",
    style="realistic",
    size="1024x1024"
)

4. Seedance视频生成工具

seedance_generate_video_tool(
    prompt: str = "", 
    first_frame_image: str = None,
    last_frame_image: str = None, 
    duration: int = 5,
    resolution: str = "720p", 
    ratio: str = "16:9"
) -> str

使用Seedance AI模型生成视频。

参数：

prompt: 视频描述文本（图像转视频时可选）
first_frame_image: 首帧图像的URL或base64
last_frame_image: 尾帧图像的URL或base64（可选）
duration: 视频时长（5或10秒）
resolution: 视频分辨率（480p, 720p, 1080p）
ratio: 宽高比（16:9, 4:3, 1:1, 3:4, 9:16, adaptive等）

示例：

# 文本生成视频
result = seedance_generate_video_tool(
    prompt="一只鸟在天空中飞翔",
    duration=5,
    resolution="720p"
)

# 首帧生成视频
result = seedance_generate_video_tool(
    first_frame_image="https://example.com/first_frame.jpg",
    duration=5
)

5. 其他工具

Seededit角色维持工具: 保持图像中主要角色的一致性
Seed1.6 VLM工具: 执行视觉语言任务
图像选择器: 从多个图像中选择最佳的一个
视频选择器: 从多个视频中选择最佳的一个
TOS保存工具: 将内容保存到TOS并返回URL

📁 项目结构

media-agent-mcp/
├── src/
│   └── media_agent_mcp/
│       ├── __init__.py
│       ├── server.py              # MCP服务器主文件
│       ├── ai_models/             # AI模型模块
│       │   ├── __init__.py
│       │   ├── seedream.py        # 图像生成
│       │   ├── seedance.py        # 视频生成
│       │   ├── seededit.py        # 图像编辑
│       │   └── seed16.py          # 视觉语言模型
│       ├── video/                 # 视频处理模块
│       │   ├── __init__.py
│       │   └── processor.py       # 视频处理功能
│       ├── storage/               # 存储模块
│       │   ├── __init__.py
│       │   └── tos_client.py      # TOS客户端
│       └── media_selectors/       # 媒体选择器
│           ├── __init__.py
│           ├── image_selector.py  # 图像选择
│           └── video_selector.py  # 视频选择
├── .env.template                  # 环境变量模板
├── .gitignore                     # Git忽略文件
├── pyproject.toml                 # 项目配置
├── uv.lock                        # 依赖锁定文件
└── README.md                      # 项目文档

🔑 API密钥获取

TOS存储

访问 BytePlus TOS控制台
创建存储桶并获取访问密钥
记录访问密钥、秘密密钥和存储桶名称

ModelArk API

访问 BytePlus ModelArk控制台
获取API密钥
选择合适的模型端点

火山引擎视觉智能

访问火山引擎控制台
开通视觉智能服务
获取访问密钥和秘密密钥

🐛 故障排除

常见问题

相对导入错误

ImportError: attempted relative import with no known parent package

解决方案: 使用模块方式运行：

cd src
python -m media_agent_mcp.server

环境变量未设置 确保 .env 文件已正确配置所有必要的API密钥。

依赖安装问题

pip install --upgrade pip
pip install -e .

或使用uv：

uv sync --reinstall

TOS上传失败
- 检查TOS配置是否正确
- 确认存储桶权限设置
- 验证网络连接
AI模型调用失败
- 检查API密钥是否有效
- 确认模型端点配置
- 查看API配额和限制

📝 开发

开发环境设置

# 克隆仓库
git clone <repository-url>
cd media-agent-mcp

# 使用uv创建虚拟环境并安装依赖
uv sync

# 激活虚拟环境
source .venv/bin/activate  # Linux/macOS
# 或
.venv\Scripts\activate     # Windows

运行测试

# 运行测试套件
uv run test_server.py

# 运行特定测试
python -m pytest tests/

构建和发布

# 构建包
uv build

# 发布到PyPI
uv publish

添加新工具

在相应模块中实现功能
在 server.py 中添加 @mcp.tool() 装饰器
添加类型注解和文档字符串
更新README文档
添加测试用例

代码规范

使用类型注解
遵循PEP 8代码风格
添加详细的文档字符串
包含错误处理
返回统一的JSON格式

📊 性能优化

使用异步处理提高并发性能
实现缓存机制减少重复计算
优化文件上传和下载流程
合理设置超时和重试机制

🔒 安全考虑

不要在代码中硬编码API密钥
使用环境变量管理敏感信息
验证输入参数防止注入攻击
限制文件上传大小和类型
定期更新依赖包

📄 许可证

MIT License

🤝 贡献

欢迎提交Issue和Pull Request！

贡献流程

Fork 仓库
创建功能分支
提交更改
添加测试
提交Pull Request

📞 支持

如有问题，请：

查看本文档的故障排除部分
搜索已有的Issues
提交新的Issue
联系开发团队

📈 版本历史

v0.1.0 (Alpha) - 初始版本，包含9个核心工具
v2.2.0 add subtitle and description to tools

Project details

These details have not been verified by PyPI

Release history Release notifications | RSS feed

2.8.0

Sep 9, 2025

2.7.3

Sep 8, 2025

2.7.2

Sep 8, 2025

2.7.0

Sep 7, 2025

2.6.14

Sep 5, 2025

2.6.13

Sep 5, 2025

2.6.12

Sep 5, 2025

2.6.11

Sep 5, 2025

2.6.10

Sep 5, 2025

2.6.9

Sep 5, 2025

2.6.7

Sep 5, 2025

2.6.6

Sep 5, 2025

2.6.5

Sep 5, 2025

2.6.4

Sep 5, 2025

2.6.3

Sep 4, 2025

2.6.2

Sep 4, 2025

2.6.1

Sep 4, 2025

2.6.0

Sep 4, 2025

2.5.11

Sep 3, 2025

2.5.10

Sep 2, 2025

2.5.9

Sep 2, 2025

2.5.8

Sep 2, 2025

2.5.7

Sep 2, 2025

2.5.6

Sep 2, 2025

2.5.5

Sep 2, 2025

2.5.4

Sep 2, 2025

2.5.3

Sep 2, 2025

2.5.2

Sep 2, 2025

2.5.1

Sep 2, 2025

2.5.0

Aug 30, 2025

2.4.20

Aug 29, 2025

2.4.19

Aug 29, 2025

2.4.18

Aug 29, 2025

2.4.17

Aug 29, 2025

2.4.16

Aug 29, 2025

2.4.15

Aug 29, 2025

2.4.14

Aug 26, 2025

2.4.13

Aug 26, 2025

2.4.12

Aug 26, 2025

2.4.11

Aug 26, 2025

2.4.10

Aug 26, 2025

2.4.9

Aug 26, 2025

2.4.8

Aug 26, 2025

2.4.7

Aug 26, 2025

2.4.6

Aug 26, 2025

2.4.5

Aug 26, 2025

2.4.4

Aug 26, 2025

2.4.3

Aug 26, 2025

2.4.2

Aug 26, 2025

2.4.1

Aug 26, 2025

2.4.0

Aug 26, 2025

2.3.1

Aug 22, 2025

2.3.0

Aug 22, 2025

2.2.2

Aug 22, 2025

2.2.1

Aug 20, 2025

This version

2.2.0

Aug 20, 2025

2.1.10

Aug 15, 2025

2.1.9

Aug 15, 2025

2.1.8

Aug 14, 2025

2.1.7

Aug 14, 2025

2.1.6

Aug 14, 2025

2.1.5

Aug 14, 2025

2.1.4

Aug 13, 2025

2.1.3

Aug 13, 2025

2.1.2

Aug 13, 2025

2.1.1

Aug 13, 2025

2.1.0

Aug 13, 2025

2.0.8

Aug 13, 2025

2.0.7

Aug 13, 2025

2.0.6

Aug 13, 2025

2.0.5

Aug 13, 2025

2.0.4

Aug 13, 2025

2.0.3

Aug 13, 2025

2.0.2

Aug 13, 2025

2.0.1

Aug 13, 2025

1.3.1

Aug 4, 2025

1.3

Aug 4, 2025

1.2.1

Aug 4, 2025

1.2

Aug 4, 2025

1.1

Aug 2, 2025

1.0

Aug 1, 2025

Download files

Download the file for your platform. If you're not sure which to choose, learn more about installing packages.

Source Distribution

media_agent_mcp-2.2.0.tar.gz (43.0 kB view details)

Uploaded Aug 20, 2025 Source

Built Distribution

If you're not sure about the file name format, learn more about wheel file names.

The dropdown lists show the available interpreters, ABIs, and platforms. Enable javascript to be able to filter the list of wheel files.

media_agent_mcp-2.2.0-py3-none-any.whl (49.2 kB view details)

Uploaded Aug 20, 2025 Python 3

File details

Details for the file media_agent_mcp-2.2.0.tar.gz.

File metadata

Download URL: media_agent_mcp-2.2.0.tar.gz
Upload date: Aug 20, 2025
Size: 43.0 kB
Tags: Source
Uploaded using Trusted Publishing? No
Uploaded via: uv/0.8.4

File hashes

Hashes for media_agent_mcp-2.2.0.tar.gz
Algorithm	Hash digest
SHA256	`a8717bfda3cf3a4dbac0a30fa1ffa9c6086a03d55878d5b388e34cd2c425bb0b`
MD5	`14c55f53311121f556b84b96f445541a`
BLAKE2b-256	`4354a8146cd1264be7e56efdcb9911bbc22d33ecd093127dabed7424c87ab9c6`

See more details on using hashes here.

File details

Details for the file media_agent_mcp-2.2.0-py3-none-any.whl.

File metadata

Download URL: media_agent_mcp-2.2.0-py3-none-any.whl
Upload date: Aug 20, 2025
Size: 49.2 kB
Tags: Python 3
Uploaded using Trusted Publishing? No
Uploaded via: uv/0.8.4

File hashes

Hashes for media_agent_mcp-2.2.0-py3-none-any.whl
Algorithm	Hash digest
SHA256	`e8e9e27490d2f88f561dc12363e7da113466b8a89d69e403ced9ce36cf8e91ca`
MD5	`49d3d34102da8b6846f5aafb030b6cf7`
BLAKE2b-256	`b762a81c718beff9c1c3efa9a444b05f0e61fa256111ac3fd15c2395b4104798`

See more details on using hashes here.

media-agent-mcp 2.2.0

Navigation

Verified details

Maintainers

Unverified details

Meta

Classifiers

Project description

Media Agent MCP

🚀 功能特性

核心工具 (9个)

AI模型支持

📋 系统要求

🛠️ 安装

方法一：使用 UVX（推荐）

方法二：本地开发安装

1. 克隆仓库

2. 安装依赖

3. 配置环境变量

🚀 使用方法

启动MCP服务器

使用 UVX

使用 UV（本地开发）

使用stdio传输（默认）

使用SSE传输

直接运行服务器文件

命令行选项

与MCP客户端集成

Claude Desktop配置

VS Code MCP扩展配置

🔧 API工具详细说明

1. 视频拼接工具

2. 视频帧提取工具

3. Seedream图像生成工具

4. Seedance视频生成工具

5. 其他工具

📁 项目结构

🔑 API密钥获取

TOS存储

ModelArk API

火山引擎视觉智能

🐛 故障排除

常见问题

📝 开发

开发环境设置

运行测试

构建和发布

添加新工具

代码规范

📊 性能优化

🔒 安全考虑

📄 许可证

🤝 贡献

贡献流程

📞 支持

📈 版本历史

Project details

Verified details

Maintainers

Unverified details

Meta

Classifiers

Release history Release notifications | RSS feed

Download files

Source Distribution

Built Distribution

File details

File metadata

File hashes

File details

File metadata

File hashes