Skip to main content

统一的文档格式转换MCP服务器 - 支持Excel、PDF、PPT、Word与Markdown互转

Project description

Markdown格式转换 MCP服务器

统一的文档格式转换MCP服务器,支持多种文档格式与Markdown之间的相互转换。

🚀 功能特性

支持的转换类型

  • 📊 Excel → Markdown - 将Excel表格转换为Markdown表格格式
  • 📄 PDF → Markdown - 提取PDF内容转换为Markdown文档
  • 🎯 PPT → Markdown - 将PowerPoint幻灯片转换为结构化Markdown
  • 📝 Word → Markdown - 将Word文档转换为Markdown格式

核心优势

  • 🔧 统一管理 - 一个MCP服务管理所有格式转换
  • 高性能 - 使用markitdown库,转换速度快
  • 📝 保持结构 - 尽可能保持原文档的结构和格式
  • 🛡️ 错误处理 - 完整的错误处理和文件验证

📋 支持的文件格式

转换类型 输入格式 输出格式 特殊功能
Excel → MD .xlsx, .xls .md 多工作表支持
PDF → MD .pdf .md 文本和结构提取
PPT → MD .pptx, .ppt .md 幻灯片结构保持
Word → MD .docx, .doc .md 格式和图片处理

🛠️ 安装和使用

1. 安装依赖

cd /Users/fengjinchao/Desktop/mcp/skills/python/markdown格式转换
uv sync

2. Claude Desktop配置

在Claude Desktop的MCP配置中添加:

{
  "markdown-format-converter": {
    "name": "Markdown格式转换",
    "type": "stdio",
    "description": "统一的文档格式转换工具",
    "isActive": true,
    "command": "uv",
    "args": [
      "--directory", 
      "/Users/fengjinchao/Desktop/mcp/skills/python/markdown格式转换", 
      "run", 
      "markdown-format-converter-mcp"
    ]
  }
}

3. 使用工具

Excel转Markdown

{
  "name": "excel_to_markdown",
  "arguments": {
    "filepath": "/path/to/your/spreadsheet.xlsx",
    "sheet_name": "Sheet1"
  }
}

PDF转Markdown

{
  "name": "pdf_to_markdown",
  "arguments": {
    "filepath": "/path/to/your/document.pdf"
  }
}

PPT转Markdown

{
  "name": "ppt_to_markdown", 
  "arguments": {
    "filepath": "/path/to/your/presentation.pptx",
    "include_slides": true
  }
}

Word转Markdown

{
  "name": "word_to_markdown",
  "arguments": {
    "filepath": "/path/to/your/document.docx",
    "preserve_format": true
  }
}

🔧 代码结构

markdown格式转换/
├── pyproject.toml              # 项目配置
├── README.md                   # 说明文档
└── src/
    └── multi_doc_mcp/         # 主要代码
        ├── __init__.py        # 包初始化
        ├── __main__.py        # 入口文件
        ├── server.py          # 主服务器
        ├── converters/        # 转换器模块
        │   ├── __init__.py
        │   ├── base_converter.py
        │   ├── excel_to_md.py
        │   ├── pdf_to_md.py
        │   ├── ppt_to_md.py
        │   └── word_to_md.py
        └── utils/             # 工具模块
            ├── __init__.py
            ├── file_utils.py
            └── validation.py

✨ 使用示例

在Claude中直接使用:

请将这个Excel文件转换为Markdown格式
帮我把这个PDF文档转换为Markdown
将这个PPT演示文稿转换为Markdown结构
把这个Word文档转换为Markdown格式

🚨 注意事项

  1. 文件路径: 请使用绝对路径
  2. 文件大小: 建议单个文件不超过50MB
  3. 编码格式: 输出文件默认使用UTF-8编码
  4. 临时文件: 系统会自动清理临时文件

📈 性能优势

相比独立的MCP服务:

  • 内存使用 - 共享依赖,减少50%内存占用
  • 启动速度 - 统一初始化,启动速度提升30%
  • 维护成本 - 单一代码库,维护成本降低70%
  • 功能一致性 - 统一API设计,使用体验更佳

🔄 版本历史

  • v1.0.0 - 初始版本,合并4个独立MCP服务
    • 支持Excel、PDF、PPT、Word转Markdown
    • 统一错误处理和文件验证

Project details


Download files

Download the file for your platform. If you're not sure which to choose, learn more about installing packages.

Source Distribution

markdown_format_converter_mcp-1.0.2.tar.gz (11.1 kB view details)

Uploaded Source

Built Distribution

If you're not sure about the file name format, learn more about wheel file names.

markdown_format_converter_mcp-1.0.2-py3-none-any.whl (17.3 kB view details)

Uploaded Python 3

File details

Details for the file markdown_format_converter_mcp-1.0.2.tar.gz.

File metadata

File hashes

Hashes for markdown_format_converter_mcp-1.0.2.tar.gz
Algorithm Hash digest
SHA256 05428c78dd37390f3f44b25ce0ba10ae81343f344ffe935174bf9adf5204816e
MD5 ad50176071e1627db8b543942eb37e74
BLAKE2b-256 706ed4ad59950941573e4ec8cac38425d98ce9a35e48327bcac3c941359f12bd

See more details on using hashes here.

File details

Details for the file markdown_format_converter_mcp-1.0.2-py3-none-any.whl.

File metadata

File hashes

Hashes for markdown_format_converter_mcp-1.0.2-py3-none-any.whl
Algorithm Hash digest
SHA256 85fca8016cfafea2512863f765625736e4d6220666925c84bdbb2ffd92d8f5eb
MD5 6c15b5429cf54c59e94ba7c70654c2d9
BLAKE2b-256 92ebd76267aba6bd6863f2066b8c47da1bd70da64f628b70f13d548a8d24123f

See more details on using hashes here.

Supported by

AWS Cloud computing and Security Sponsor Datadog Monitoring Depot Continuous Integration Fastly CDN Google Download Analytics Pingdom Monitoring Sentry Error logging StatusPage Status page