openai-router

Project description

🚀 OpenAI Router

轻量级、持久化、零配置的 OpenAI API 统一网关
一键聚合 vLLM、SGLang、lmdeploy、Ollama…

将不同推理框架（vLLM、SGLang、lmdeploy、Ollama…）、不同 Host、不同 Port 的 OpenAI API 接口统一聚合到同一个 base_url 上，实现更便捷的模型调用。

✨ Features

Feature	Description
🌍 统一入口	`/chat/completions`、`/embeddings`、`/images/generations`… 全部转发
🧩 多后端	vLLM、SGLang、lmdeploy、Ollama… 任意组合
💾 持久化	SQLite + SQLModel 零配置存储路由
⚡ 负载均衡	可配置多个同名模型，自动进行轮询式负载均衡
🎨 Web UI	Gradio 即用的管理面板
🔍 兼容 OpenAI	SDK / LangChain / AutoGen / LlamaIndex / CrewAI 等一行代码都不用改

快速开始

运行前准备

Python 3.11+
一个已经能正常工作的 OpenAI 兼容后端
后端地址建议先单独验证可用，例如：

curl http://127.0.0.1:8001/v1/models

方式一：在当前仓库内运行（推荐）

适合你现在这种直接使用本项目源码的方式。

uv sync
uv run openai-router --host 0.0.0.0 --port 28000

如果你不用 uv，也可以：

pip install -e .
openai-router --host 0.0.0.0 --port 28000

方式二：从 PyPI 安装

uv tool install openai-router
openai-router --host 0.0.0.0 --port 28000

或者：

pip install -U openai-router
openai-router --host 0.0.0.0 --port 28000

`uv tool` 安装和使用示例

如果你不想进入项目源码目录，也不想自己管理虚拟环境，可以直接用 uv tool：

uv tool install openai-router
uv tool run openai-router --host 0.0.0.0 --port 28000

如果你刚安装完，命令还没有生效，可以先执行：

uv tool update-shell

然后重新打开终端，再检查：

openai-router --help

启动后，继续按本文后面的步骤：

打开 http://127.0.0.1:28000/ 配置模型路由
使用 http://127.0.0.1:28000/v1 作为统一 base_url

启动后你应该看到什么

服务启动后可访问：

Web UI：http://127.0.0.1:28000/
Swagger：http://127.0.0.1:28000/docs
健康检查：http://127.0.0.1:28000/health
OpenAI 兼容入口：http://127.0.0.1:28000/v1

先验证健康检查：

curl -i http://127.0.0.1:28000/health

返回 HTTP/1.1 200 OK 说明服务已启动。

教程一：手动添加一条模型路由

这是最直接、最不容易出错的用法，建议第一次先用这个方式跑通。

场景

假设你的后端服务地址是：

http://127.0.0.1:8001/v1

并且这个后端支持模型 gpt-4o。

操作步骤

打开 http://127.0.0.1:28000/
在“模型路由”页填写：
- 模型名称：gpt-4o
- 模型别名：可留空，或填写 gpt-4o-latest
- 后端 URL：http://127.0.0.1:8001/v1
- 后端 API 密钥：按需填写
点击“添加 / 更新路由”

每个字段怎么理解

模型名称：客户端请求时 model 字段使用的名字
模型别名：可选，多个别名用英文逗号分隔
后端 URL：填写后端“基地址”，不要填写具体接口路径
后端 API 密钥：
- 填了：Router 会用这个密钥覆盖客户端传入的 Authorization
- 不填：Router 会透传客户端原始 Authorization

后端 URL 的正确写法

正确示例：

http://127.0.0.1:8001
http://127.0.0.1:8001/v1

错误示例：

http://127.0.0.1:8001/v1/chat/completions
http://127.0.0.1:8001/v1/models

原因是 Router 会自动把请求路径拼接到你填写的后端 URL 后面。

教程二：自动同步一个后端源

如果你的后端支持模型列表接口，这个方式更省事。

Router 的自动发现规则

当你添加“后端源”时，Router 会立即尝试获取模型列表：

如果你填的是 http://127.0.0.1:8001，会优先请求 /v1/models，再尝试 /models
如果你填的是 http://127.0.0.1:8001/v1，会请求 /v1/models

操作步骤

打开 http://127.0.0.1:28000/sources
填写：
- 后端源 URL：http://127.0.0.1:8001/v1
- 后端源 API 密钥：按需填写
- 排除模型：可留空；多个模型用逗号分隔
- 自动同步间隔：例如 15
点击“添加 / 更新后端配置”

保存后会立即拉取一次模型列表，并自动生成对应路由。

什么时候用“排除模型”

如果后端暴露了很多模型，但你只想导入一部分，可以在这里填不想暴露出去的模型名。

一个重要行为

自动同步导入的路由属于“自动管理”：

你手工删掉某条自动路由后，后端下次同步时可能会再次创建回来
如果你不想它再出现，应当：
- 在“排除模型”中排除它
- 或直接删除该后端源

教程三：像 OpenAI 官方 SDK 一样调用

配置好路由后，业务代码只需要把 base_url 指向 Router。

先列出模型确认路由是否生效

curl http://127.0.0.1:28000/v1/models \
  -H "Authorization: Bearer sk-test"

你应该能看到刚才配置的模型名或别名。

Python 示例

from openai import OpenAI

client = OpenAI(
    base_url="http://127.0.0.1:28000/v1",
    api_key="sk-test",
)

resp = client.chat.completions.create(
    model="gpt-4o",
    messages=[{"role": "user", "content": "hello"}],
    stream=False,
)

print(resp.choices[0].message.content)

cURL 示例

如果你没有在 Router 中给该后端配置专用 API Key，那么这里的 Authorization 需要是真实可用的后端密钥。

curl http://127.0.0.1:28000/v1/chat/completions \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer sk-test" \
  -d '{
    "model": "gpt-4o",
    "messages": [{"role": "user", "content": "你好"}]
  }'

流式输出示例

from openai import OpenAI

client = OpenAI(
    base_url="http://127.0.0.1:28000/v1",
    api_key="sk-test",
)

stream = client.chat.completions.create(
    model="gpt-4o",
    messages=[{"role": "user", "content": "请介绍一下你自己"}],
    stream=True,
)

for chunk in stream:
    text = chunk.choices[0].delta.content or ""
    print(text, end="")

多后端负载均衡怎么用

如果你给同一个模型名配置了多个后端，例如：

gpt-4o -> http://127.0.0.1:8001/v1
gpt-4o -> http://127.0.0.1:8002/v1

那么 Router 会把同一个 model 的请求分发到这些后端。

当前支持两种策略：

round_robin：默认策略，轮询分发
consistent_hash：同一会话尽量稳定落到同一后端

在 http://127.0.0.1:28000/sources 页面可以切换策略。

consistent_hash 会优先参考这些请求头：

X-Session-ID
X-User-ID
X-Tenant-ID
X-Correlation-ID
X-Request-ID
X-Trace-ID

如果没有这些请求头，会再尝试请求体里的 session_params.session_id、user、session_id、user_id。

支持的主要接口

除了 /v1/models 之外，Router 还会转发这些常见 OpenAI 风格接口：

POST /v1/responses
POST /v1/completions
POST /v1/chat/completions
POST /v1/embeddings
POST /v1/moderations
POST /v1/images/generations
POST /v1/images/edits
POST /v1/images/variations
POST /v1/audio/transcriptions
POST /v1/audio/speech
POST /v1/rerank
POST /tokenize
POST /detokenize

Docker 用法

仓库已经提供了可直接使用的 Dockerfile 和 docker-compose.yml。

启动

docker compose up --build -d

访问地址

Web UI：http://127.0.0.1:8000/
OpenAI 兼容入口：http://127.0.0.1:8000/v1

停止

docker compose down

容器内数据目录挂载为：

./data -> /app/data

数据持久化

使用 SQLite 持久化保存路由配置。

源码方式运行时，数据库默认在：

./data/routes.db

因此你重启服务后，路由配置仍然会保留。

常见问题

1. 为什么 `/v1/models` 没有我刚配置的模型？

按这个顺序排查：

先看 UI 表格里是否真的保存成功
检查模型名是否填错
检查后端 URL 是否写成了具体接口路径
如果是自动同步方式，确认后端的 /v1/models 能正常返回
直接访问 http://127.0.0.1:28000/v1/models 看返回结果

2. 客户端的 API Key 应该填什么？

如果你在 Router 里为后端配置了 API Key：客户端可以填任意非空值，例如 sk-test
如果你没有在 Router 里配置后端 API Key：客户端必须传真实后端可用的 Bearer Token

3. 为什么我删除了一条自动同步的模型路由，它又出现了？

因为该模型还存在于后端的模型列表中，下次自动同步会重新导入。

正确做法是：

在“排除模型”中排除它
或删除对应后端源

4. 后端 URL 到底填不填 `/v1`？

两种都可以：

http://127.0.0.1:8001
http://127.0.0.1:8001/v1

但不要填写到具体接口层级，例如 /v1/chat/completions。

5. Router 自己支持鉴权吗？

当前项目主要做路由和转发，不提供单独的 Router 管理鉴权体系。它对请求头中的 Authorization 的处理逻辑是：

有后端专用 API Key：覆盖转发
没有后端专用 API Key：原样透传

架构图

Project details

Release history Release notifications | RSS feed

0.1.17

Jun 16, 2026

0.1.16

Jun 4, 2026

0.1.15

Jun 4, 2026

0.1.14

Jun 1, 2026

0.1.13

May 31, 2026

0.1.12

May 31, 2026

0.1.11

May 21, 2026

0.1.10

May 20, 2026

0.1.9

May 15, 2026

This version

0.1.8

May 9, 2026

0.1.7

May 7, 2026

0.1.6

May 7, 2026

0.1.5

Dec 2, 2025

0.1.4

Dec 1, 2025

0.1.3

Nov 6, 2025

0.1.2

Nov 3, 2025

0.1.1

Nov 3, 2025

0.1.0

Nov 3, 2025

Download files

Download the file for your platform. If you're not sure which to choose, learn more about installing packages.

Source Distribution

openai_router-0.1.8.tar.gz (32.3 kB view details)

Uploaded May 9, 2026 Source

Built Distribution

If you're not sure about the file name format, learn more about wheel file names.

The dropdown lists show the available interpreters, ABIs, and platforms. Enable javascript to be able to filter the list of wheel files.

openai_router-0.1.8-py3-none-any.whl (26.9 kB view details)

Uploaded May 9, 2026 Python 3

File details

Details for the file openai_router-0.1.8.tar.gz.

File metadata

Download URL: openai_router-0.1.8.tar.gz
Upload date: May 9, 2026
Size: 32.3 kB
Tags: Source
Uploaded using Trusted Publishing? Yes
Uploaded via: twine/6.1.0 CPython/3.13.12

File hashes

Hashes for openai_router-0.1.8.tar.gz
Algorithm	Hash digest
SHA256	`69fcb8a2f454c11485db0e4c9462ae927721492afa44f937d07948d9f37ad854`
MD5	`802d030138ce2384b8178e95f5439403`
BLAKE2b-256	`ca1365bf0f4402840735b3c4a3f6d1e2e4ac30a4c47a511842d802c250b039e2`

See more details on using hashes here.

Provenance

The following attestation bundles were made for openai_router-0.1.8.tar.gz:

Publisher: pypi.yml on shell-nlp/openai_router

Attestations: Values shown here reflect the state when the release was signed and may no longer be current.

Statement:
- Statement type: https://in-toto.io/Statement/v1
- Predicate type: https://docs.pypi.org/attestations/publish/v1
- Subject name: openai_router-0.1.8.tar.gz
- Subject digest: 69fcb8a2f454c11485db0e4c9462ae927721492afa44f937d07948d9f37ad854
- Sigstore transparency entry: 1485926570
- Sigstore integration time: May 9, 2026
Source repository:
- Permalink: shell-nlp/openai_router@015adaadee51d6355232b53f768fa8c9dee39242
- Branch / Tag: refs/tags/v0.1.8
- Owner: https://github.com/shell-nlp
- Access: public
Publication detail:
- Token Issuer: https://token.actions.githubusercontent.com
- Runner Environment: github-hosted
- Publication workflow: pypi.yml@015adaadee51d6355232b53f768fa8c9dee39242
- Trigger Event: push

File details

Details for the file openai_router-0.1.8-py3-none-any.whl.

File metadata

Download URL: openai_router-0.1.8-py3-none-any.whl
Upload date: May 9, 2026
Size: 26.9 kB
Tags: Python 3
Uploaded using Trusted Publishing? Yes
Uploaded via: twine/6.1.0 CPython/3.13.12

File hashes

Hashes for openai_router-0.1.8-py3-none-any.whl
Algorithm	Hash digest
SHA256	`3b19b76f583216ae04a60f9dcd083f7ce790f73ce41f110e7702c513b2a40e0f`
MD5	`22fc316809f68547eade60551325cf03`
BLAKE2b-256	`514591f08042e4024a7cda6d0ae0796284474563984c25aab71259884abea3a3`

See more details on using hashes here.

Provenance

The following attestation bundles were made for openai_router-0.1.8-py3-none-any.whl:

Publisher: pypi.yml on shell-nlp/openai_router

Attestations: Values shown here reflect the state when the release was signed and may no longer be current.

Statement:
- Statement type: https://in-toto.io/Statement/v1
- Predicate type: https://docs.pypi.org/attestations/publish/v1
- Subject name: openai_router-0.1.8-py3-none-any.whl
- Subject digest: 3b19b76f583216ae04a60f9dcd083f7ce790f73ce41f110e7702c513b2a40e0f
- Sigstore transparency entry: 1485926585
- Sigstore integration time: May 9, 2026
Source repository:
- Permalink: shell-nlp/openai_router@015adaadee51d6355232b53f768fa8c9dee39242
- Branch / Tag: refs/tags/v0.1.8
- Owner: https://github.com/shell-nlp
- Access: public
Publication detail:
- Token Issuer: https://token.actions.githubusercontent.com
- Runner Environment: github-hosted
- Publication workflow: pypi.yml@015adaadee51d6355232b53f768fa8c9dee39242
- Trigger Event: push

openai-router 0.1.8

Navigation

Verified details

Maintainers

Unverified details

Meta

Project description

🚀 OpenAI Router

✨ Features

快速开始

运行前准备

方式一：在当前仓库内运行（推荐）

方式二：从 PyPI 安装

uv tool 安装和使用示例

启动后你应该看到什么

教程一：手动添加一条模型路由

场景

操作步骤

每个字段怎么理解

后端 URL 的正确写法

教程二：自动同步一个后端源

Router 的自动发现规则

操作步骤

什么时候用“排除模型”

一个重要行为

教程三：像 OpenAI 官方 SDK 一样调用

先列出模型确认路由是否生效

Python 示例

cURL 示例

流式输出示例

多后端负载均衡怎么用

支持的主要接口

Docker 用法

启动

访问地址

停止

数据持久化

常见问题

1. 为什么 /v1/models 没有我刚配置的模型？

2. 客户端的 API Key 应该填什么？

3. 为什么我删除了一条自动同步的模型路由，它又出现了？

4. 后端 URL 到底填不填 /v1？

5. Router 自己支持鉴权吗？

架构图

Project details

Verified details

Maintainers

Unverified details

Meta

Release history Release notifications | RSS feed

Download files

Source Distribution

Built Distribution

File details

File metadata

File hashes

Provenance

File details

File metadata

File hashes

Provenance

`uv tool` 安装和使用示例

1. 为什么 `/v1/models` 没有我刚配置的模型？

4. 后端 URL 到底填不填 `/v1`？