大模型会话、对话内容预览与修改、语音识别、文本转语音、文档重排、文本嵌入、知识库系统和MCP服务的一键式API服务

These details have not been verified by PyPI

Project links

Project description

any4any: 大模型会话、对话内容预览与修改、语音识别、文本转语音、文档重排、文本嵌入、知识库系统和MCP服务的一键式API服务

中文简体 · English

功能特性

核心功能：启动运行本项目后，您可以将几乎所有类型模型以openai-api兼容接口形式暴露，可被任何模型管理应用添加，可追踪用户对话历史，具体功能模块介绍如下：

会话管理：支持多平台与LLM会话管的理，可将本地模型以openai-api兼容接口形式暴露，可被任何模型管理应用添加，可追踪用户对话历史
预览模式：支持LLM响应内容预览和编辑功能
钉钉机器人：支持钉钉机器人消息处理
语音转录：将音频文件转换为文本（支持多种语言）
文本转语音：将文本转换为语音文件（支持多种语音风格）：默认使用zh-CN-XiaoyiNeural音色
知识库：提供独立的embbeding和rerank能力，可基于ChromaDB向量数据库构建知识库系统
MCP服务：支持构建MCP工具、接口，可在任意MCP客户端调用
API文档：自动生成API使用说明，可通过浏览器访问：http://localhost:8888/docs#/

更新内容

2025.10.08(V0.1.1)：新增嵌入模型（Embedding）模块

新增：

Embedding模块：完整的嵌入模型支持，包括文档处理、向量存储、检索引擎等功能
文档处理：支持文档解析、分块、向量化等处理流程
向量存储：高效的向量存储和管理机制
检索引擎：基于相似度的文档检索功能
知识库服务器：提供知识库的创建、管理和查询服务
OpenAI API兼容接口：支持与OpenAI嵌入API一致的调用方式
知识库系统说明文档.md

2025.9.26(V0.1.0)：新增会话管理和预览模式功能

新增：

会话管理：支持多平台会话管理，可追踪用户对话历史，实现上下文连续对话
预览模式：支持内容预览和编辑功能，用户可在内容生成后进行预览和修改，浏览器访问：http://localhost:8888/index/ 可进行预览
钉钉机器人集成：支持钉钉机器人消息处理，可在钉钉中与系统交互
用户认证增强：增加了基于API密钥的认证机制，提高系统安全性
数据库会话存储：将会话数据存储到MySQL数据库，支持持久化和查询
会话管理系统说明文档.md

更新：

重塑了项目结构，新增data_models模块用于管理数据模型，新增servers模块用于管理服务，新增static目录用于管理静态文件

2025.5.24(V0.0.6)：新增支持构建MCP服务

新增：

MCP工具构建：可在core/mcp_tools.py中任意添加MCP工具，默认提供了两个整数的加、减、乘和除的计算
MCP工具注册：在app.py中引入对应的模块，如from core.mcp_tools import add, sub, mul, div，并在mcp.tool()函数中注册
MCP服务服务启动：运行启动命令：python cli.py或a4a-run，服务将运行在: http://localhost:9999/sse

dify工作流文件:mcp_test.yml

前置环境要求

WSL2 (Windows Subsystem for Linux)：Windows系统下的必要条件
Conda (Anaconda or Miniconda)：用于管理Python环境
Docker-desktop：Windows系统下的Docker桌面应用，用于运行dify服务
MySQL：用于存储会话数据

安装指南

1.克隆本项目

git clone https://github.com/eogee/any4any.git
# 或
git clone https://gitee.com/eogee/any4any.git
# 或
git clone https://gitcode.com/eogee/any4any.git

你也可以通过网盘下载本项目：https://pan.quark.cn/s/fbe126d5bd75

2.下载模型

# 确认已安装git-lfs (https://git-lfs.com)，用于下载大文件
# 您可在huggingface.co/modelscoup.com/hf-mirror.com站点中下载模型，此处以huggingface.co为例
git lfs install

# 下载语音识别模型：SenseVoiceSmall
git clone https://huggingface.co/FunAudioLLM/SenseVoiceSmall

# 下载重排序模型：bge-reranker-base
git clone https://huggingface.co/BAAI/bge-reranker-base

# 下载LLM模型：Qwen3-1.7B
git clone https://huggingface.co/Qwen/Qwen3-1.7B

# 下载Embedding模型：bge-small-zh-v1.5
git clone https://huggingface.co/BAAI/bge-small-zh-v1.5

3. 创建conda环境

# 创建conda环境
conda create -n any4any python=3.10
# 激活环境
conda activate any4any

4. 安装依赖

# 安装ffmpeg
sudo apt-get install ffmpeg
# 验证ffmpeg是否安装成功
ffmpeg -version
# 安装其他依赖
pip install -r requirements.txt

5. 配置环境变量

复制示例配置文件并根据需要修改：

cp .env.example .env

编辑.env文件，配置以下内容：

数据库连接信息
模型路径
API密钥
其他自定义配置

6. 启动服务

# 直接启动服务
python cli.py

# 或使用快捷命令(WSL/Linux环境),永久安装a4a-run命令:
sudo cp a4a-run.sh /usr/local/bin/a4a-run
sudo chmod +x /usr/local/bin/a4a-run
# 安装后可直接使用:
a4a-run

服务将运行在以下端口：

7. 其他模型平台应用内容添加并调用模型（此处以Dify为例子）

7.1查看宿主机的ip地址

在wsl命令行中执行ifconfig命令，查看宿主机的ip地址。

eth0: flags=4163<UP,BROADCAST,RUNNING,MULTICAST>  mtu 1500
        inet 172.21.56.14  netmask 255.255.240.0  broadcast 172.21.63.255

其中172.21.56.14即为宿主机的ip地址。

7.2导入TTS模型

启动Docker并保证dify服务正常运行。将插件langgenius-openai_api_compatible_0.0.16.difypkg导入并安装至dify中。打开OpenAI-API-compatible插件，点击添加模型，配置内容如下：

模型类型：TTS
模型名称：edge-tts
API endpoint URL：`http://172.21.56.14:8888/v1` 或 `http://host.docker.internal:8888/v1`
API Key：EMPTY
可用声音（用英文逗号分隔）：zh-CN-XiaoyiNeural
其他可空余不填

7.3导入ASR模型

配置模型路径：

#.env文件
ASR_MODEL_DIR=/mnt/c/models/SenseVoiceSmall  # 替换为你本地ASR模型路径

打开OpenAI-API-compatible插件，点击添加模型，配置内容如下：

模型类型：Speech2text
模型名称：SenseVoiceSmall
API Key：EMPTY
API endpoint URL：`http://172.21.56.14:8888/v1` 或 `http://host.docker.internal:8888/v1`

7.4导入Rerank模型

配置模型路径：

#.env文件 
RERANK_MODEL_DIR=/mnt/c/models/bge-reranker-base  # 替换为你本地rerank模型路径

同样打开OpenAI-API-compatible插件，点击添加模型，配置内容如下：

模型类型：rerank
模型名称：bge-reranker-base
API Key：EMPTY
API endpoint URL：`http://172.21.56.14:8888/v1` 或 `http://host.docker.internal:8888/v1`

7.5导入LLM模型

配置模型路径：

#.env文件
LLM_MODEL_DIR=/mnt/c/models/Qwen3-1.7B  # 替换为你本地LLM模型路径

同样打开OpenAI-API-compatible插件，点击添加模型，配置内容如下：

模型类型：LLM
模型名称：Qwen3-1.7B
API Key：EMPTY
API endpoint URL：`http://172.21.56.14:8888/v1` 或 `http://host.docker.internal:8888/v1`

7.6导入Embbding模型

配置模型路径：

#.env文件
EMBEDDING_MODEL_DIR = "/mnt/c/models/bge-small-zh-v1.5"  # 替换为你本地Embbding模型路径

同样打开OpenAI-API-compatible插件，点击添加模型，配置内容如下：

模型类型：Embbding
模型名称：bge-small-zh-v1.5
API Key：EMPTY
API endpoint URL：`http://172.21.56.14:8888/v1` 或 `http://host.docker.internal:8888/v1`

7.7设置为默认模型

在右上角系统模型设置中的最下方，将文本转语音模型设置为edge-tts，将语音识别模型设置为SenseVoiceSmall，将文档重排模型设置为bge-reranker-base，将语言模型设置为Qwen3-1.7B，将嵌入模型设置为bge-small-zh-v1.5，保存设置。

7.8使用模型

添加任意一个chatflow，进入工作流内容后在右上角功能，找到文字转语音和语音转文字功能，配置我们添加好的模型，将自动播放打开，然后对话即可。

8. dify中连接MySQL数据库

8.1连接配置

在.env文件中配置MySQL数据库连接信息:

MYSQL_HOST=172.21.48.1  # 在cmd中使用ipconfig | findstr "IPv4" 查看并替换为你的实际的IP地址
MYSQL_PORT=3306
MYSQL_USER=root
MYSQL_PASSWORD=root
MYSQL_DATABASE=any4any  # 替换为你的数据库名称

8.2MySQL数据库配置

在MySQL服务中运行以下命令，允许wsl中的宿主机（172.21.56.14）访问数据库：

-- 允许 wsl中的宿主机（172.21.56.14）访问数据库 使用 root 用户连接所有数据库（*.*）
-- YOUR_PASSWORD 替换为你的数据库密码
GRANT ALL PRIVILEGES ON *.* TO 'root'@'172.21.56.14' IDENTIFIED BY 'YOUR_PASSWORD';

-- 如果 MySQL 8.0+，可能需要分开创建用户并授权
CREATE USER 'root'@'172.21.56.14' IDENTIFIED BY 'YOUR_PASSWORD';
GRANT ALL PRIVILEGES ON *.* TO 'root'@'172.21.56.14';

8.3构建http请求

在dify中的workflow或chatflow中添加http请求节点，配置信息如下：

请求方式：POST
请求地址：http://localhost:8888/v1/db/query
form-data参数名：query
form-data参数值：SELECT * FROM users LIMIT 1  # 示例查询语句

工程结构

any4any/
├── core/                     # 核心功能模块
│   ├── asr/                  # 语音识别模块
│   │   └── transcription.py  # 音频转录实现
│   ├── auth/                 # 认证模块
│   │   └── model_auth.py     # 模型认证实现
│   ├── chat/                 # 聊天相关模块
│   │   ├── conversation_database.py  # 会话数据库操作
│   │   ├── conversation_manager.py   # 会话管理器
│   │   ├── delay_manager.py          # 延迟管理器
│   │   ├── llm.py            # 大语言模型接口
│   │   ├── openai_api.py     # OpenAI API兼容接口
│   │   └── preview.py        # 预览功能实现
│   ├── database/             # 数据库模块
│   │   └── database.py       # 数据库连接和查询实现
│   ├── dingtalk/             # 钉钉机器人模块
│   │   └── message_manager.py # 钉钉消息处理
│   ├── embedding/           # 嵌入模型模块
│   │   ├── document_processor.py # 文档处理器
│   │   ├── embedding_manager.py  # 嵌入管理器
│   │   ├── kb_server.py          # 知识库服务器
│   │   ├── openai_api.py         # OpenAI API接口
│   │   ├── retrieval_engine.py   # 检索引擎
│   │   └── vector_store.py       # 向量存储
│   ├── lifespan.py           # 应用生命周期管理
│   ├── log.py                # 日志管理
│   ├── mcp/                  # MCP协议模块
│   │   └── mcp_tools.py      # MCP工具实现
│   ├── rerank/               # 文档重排模块
│   │   └── rerank.py         # 文档重排实现
│   ├── tts/                  # 文本转语音模块
│   │   ├── file.py           # 音频文件处理
│   │   └── speech.py         # 语音合成实现
│   └── model_manager.py      # 模型管理器
├── data_models/              # 数据模型定义
├── servers/                  # 服务器模块
├── static/                   # 静态资源文件
├── utils/                    # 工具模块
├── workflows/                # 工作流和外部衔接插件
├── app.py                    # 应用入口文件
├── cli.py                    # 命令行接口
├── config.py                 # 配置文件
├── requirements.txt          # 依赖包列表
├── any4any.sql               # 数据库初始化脚本
├── a4a-run.sh                # 启动脚本
└── .env.example              # 环境变量示例文件

更新计划

增强会话管理功能
支持更多大语言模型
接入更多即时通讯服务商
增强前端界面，提供更友好的用户体验
增加更多TTS和ASR模型的支持
增加其他接口和服务

联系我们

官方网站：https://eogee.com
邮箱：eogee@qq.com
B站：https://space.bilibili.com/315734619
抖音：抖音eogee，每晚8点直播

Project details

These details have not been verified by PyPI

Project links

Release history Release notifications | RSS feed

This version

0.1.1

Oct 8, 2025

Download files

Download the file for your platform. If you're not sure which to choose, learn more about installing packages.

Source Distribution

any4any-0.1.1.tar.gz (149.6 kB view details)

Uploaded Oct 8, 2025 Source

Built Distribution

If you're not sure about the file name format, learn more about wheel file names.

The dropdown lists show the available interpreters, ABIs, and platforms. Enable javascript to be able to filter the list of wheel files.

any4any-0.1.1-py3-none-any.whl (179.3 kB view details)

Uploaded Oct 8, 2025 Python 3

File details

Details for the file any4any-0.1.1.tar.gz.

File metadata

Download URL: any4any-0.1.1.tar.gz
Upload date: Oct 8, 2025
Size: 149.6 kB
Tags: Source
Uploaded using Trusted Publishing? No
Uploaded via: twine/6.2.0 CPython/3.10.18

File hashes

Hashes for any4any-0.1.1.tar.gz
Algorithm	Hash digest
SHA256	`708c49ba0d25f82bc54ac9be2ab7e542d86395747b9a0820cdcb734139f797c7`
MD5	`867a99725833231e521a154ab0aa9b75`
BLAKE2b-256	`40a69194c907b29e4361a0fcbf5f98b53a70e466668e4837734a54c5398a5956`

See more details on using hashes here.

File details

Details for the file any4any-0.1.1-py3-none-any.whl.

File metadata

Download URL: any4any-0.1.1-py3-none-any.whl
Upload date: Oct 8, 2025
Size: 179.3 kB
Tags: Python 3
Uploaded using Trusted Publishing? No
Uploaded via: twine/6.2.0 CPython/3.10.18

File hashes

Hashes for any4any-0.1.1-py3-none-any.whl
Algorithm	Hash digest
SHA256	`9c7c37f7d22914b369ecf8210fc5d9949cb04e2ac8b6ec372c1655ca23a614e2`
MD5	`8d5442cf19318d179a9db49e363dbbb3`
BLAKE2b-256	`ea4283c96e1d80a210e2b0a3d3d10e8f1640e530eb51b84bbdcb8fdd96fd51e8`

See more details on using hashes here.

any4any 0.1.1

Navigation

Verified details

Maintainers

Meta

Unverified details

Project links

Meta

Classifiers

Project description

any4any: 大模型会话、对话内容预览与修改、语音识别、文本转语音、文档重排、文本嵌入、知识库系统和MCP服务的一键式API服务

功能特性

更新内容

前置环境要求

安装指南

1.克隆本项目

2.下载模型

3. 创建conda环境

4. 安装依赖

5. 配置环境变量

6. 启动服务

7. 其他模型平台应用内容添加并调用模型（此处以Dify为例子）

8. dify中连接MySQL数据库

工程结构

相关开源项目

更新计划

联系我们

Project details

Verified details

Maintainers

Meta

Unverified details

Project links

Meta

Classifiers

Release history Release notifications | RSS feed

Download files

Source Distribution

Built Distribution

File details

File metadata

File hashes

File details

File metadata

File hashes