Add your description here
Project description
MCP RAG 工具集
基于模型上下文协议(MCP)的智能知识库系统,提供文档处理、知识问答和向量库管理功能。
支持使用豆包与OpenAI
✨ 主要特性
- 🧠 智能知识库:基于向量检索的 RAG 系统,支持语义搜索和智能问答
- 📄 多格式文档处理:支持超过 25 种文档格式,包括 PDF、DOCX、PPTX、XLSX、图片、邮件等
- 🌐 直观 Web 界面:Bento 风格布局,分类展示所有工具功能
- 🤖 多模型支持:兼容 OpenAI、豆包、Ollama 等主流 AI 模型
- 🔍 高级过滤搜索:支持按文件类型、内容结构等条件进行精确检索
- 📊 统计分析:提供知识库统计、嵌入缓存分析等数据洞察
- ⚡ 本地化处理:支持本地模型推理,保护数据隐私
- 🔧 向量库管理:提供缓存清理、数据库优化等维护功能
安装
# 安装工具
uv tool install mcp_rag
# 升级工具
uv tool install mcp_rag --upgrade
# 卸载工具
uv tool uninstall mcp_rag
使用
启动 MCP 服务器
mcp_rag server
启动 Web 界面
mcp_rag web
Web 界面提供直观的 Bento 布局,支持以下工具分类:
- 📥 添加内容:添加文本和文档到知识库
- ❓ 智能问答:基于知识库进行问答和检索
- 📊 数据统计:查看知识库和系统统计信息
- ⚙️ 向量库管理:优化和维护向量数据库
配置
在项目根目录创建 .env 文件进行配置:
# 模型类型:OPENAI 或 OLLAMA
MODEL_TYPE=OPENAI
# OpenAI 配置
OPENAI_API_KEY=your_api_key
OPENAI_API_BASE=https://api.openai.com/v1
OPENAI_MODEL=gpt-4o-mini
OPENAI_TEMPERATURE=0.7
# 嵌入提供商:OPENAI 或 HF
EMBEDDING_PROVIDER=OPENAI
OPENAI_EMBEDDING_MODEL=text-embedding-3-large
mcp客户端配置(豆包为例)
{
"mcpServers": {
"rag": {
"command": "uv",
"args": [
"run",
"mcp-rag",
"serve"
],
"env": {
"PYTHONUNBUFFERED": "1",
"MODEL_TYPE": "OPENAI",
"OPENAI_API_KEY": "key",
"OPENAI_API_BASE": "https://ark.cn-beijing.volces.com/api/v3",
"OPENAI_MODEL": "doubao-1-5-pro-32k-250115",
"OPENAI_TEMPERATURE": "0",
"EMBEDDING_PROVIDER": "OPENAI",
"OPENAI_EMBEDDING_MODEL": "doubao-embedding-text-240715",
"COLLECTION_NAME": "default_collection"
}
}
}
}
可用工具
添加内容
learn_text(text, source_name)- 添加文本到知识库learn_document(file_path)- 处理并添加文档到知识库
智能问答
ask_rag(query)- 基于知识库回答问题ask_rag_filtered(query, file_type, min_tables, min_titles, processing_method)- 带过滤条件的智能检索
数据统计
get_knowledge_base_stats()- 显示知识库统计信息get_embedding_cache_stats()- 显示嵌入缓存统计get_data_paths()- 查看存储路径信息
向量库管理
clear_embedding_cache_tool()- 清理嵌入缓存optimize_vector_database()- 优化向量数据库性能get_vector_database_stats()- 显示向量数据库统计reindex_vector_database()- 重新索引向量数据库
支持格式
支持超过 25 种文档格式,包括 PDF、DOCX、PPTX、XLSX、图片、邮件等。
Project details
Release history Release notifications | RSS feed
Download files
Download the file for your platform. If you're not sure which to choose, learn more about installing packages.
Source Distribution
mcp_rag-0.3.3.tar.gz
(41.7 kB
view details)
Built Distribution
Filter files by name, interpreter, ABI, and platform.
If you're not sure about the file name format, learn more about wheel file names.
Copy a direct link to the current filters
mcp_rag-0.3.3-py3-none-any.whl
(47.6 kB
view details)
File details
Details for the file mcp_rag-0.3.3.tar.gz.
File metadata
- Download URL: mcp_rag-0.3.3.tar.gz
- Upload date:
- Size: 41.7 kB
- Tags: Source
- Uploaded using Trusted Publishing? No
- Uploaded via: uv/0.8.8
File hashes
| Algorithm | Hash digest | |
|---|---|---|
| SHA256 |
7e7e0fff57361efaafd5c61422a63a6e3534bef5c8dbadc113653bea930c8cd1
|
|
| MD5 |
a92d2f3c86eb0e3135807a65acbbfae4
|
|
| BLAKE2b-256 |
b79050394ab0f735923f4b7793d537282a1c8b8bd22ccea74cfe33d588825a5e
|
File details
Details for the file mcp_rag-0.3.3-py3-none-any.whl.
File metadata
- Download URL: mcp_rag-0.3.3-py3-none-any.whl
- Upload date:
- Size: 47.6 kB
- Tags: Python 3
- Uploaded using Trusted Publishing? No
- Uploaded via: uv/0.8.8
File hashes
| Algorithm | Hash digest | |
|---|---|---|
| SHA256 |
379d2d51e45d8be6df2278a12bf267fe8fce7e64a51c8c83503cb7742a1c053a
|
|
| MD5 |
8e63d1f11539f69121e83dc51c1d01e9
|
|
| BLAKE2b-256 |
62f29ab10d22c051b4dac4631da71c7d36b50ed415fda4b9ad1ea6af3a42f007
|