A powerful Python toolkit for simplifying LLM integration and management with multi-model scheduling, fault tolerance, and load balancing support

These details have not been verified by PyPI

Project links

Project description

llmakits

用于简化大语言模型(LLM)的集成和管理。支持多模型调度、故障转移、负载均衡等功能。

支持通过YAML配置实现不同业务场景的模型组管理，日均承载数万次LLM调用（含多模态图文请求），将多模型运维复杂度降低约70%。

功能特性

🚀 多模型支持: 支持OpenAI、智谱AI、DashScope、ModelScope等多个主流LLM平台；
🔄 智能调度: 内置多层故障转移和负载均衡机制；
- 自动切换：当模型失败时，自动切换到下个可用模型；
- 负载均衡：Token 或请求次数达到上限后，自动切换到下个api_key；
- 密钥检测：自动检测并移除API密钥用尽的模型；
- 图片处理：支持图片URL自动转base64、多图批量处理、失败域名智能降级（自动转为单图重试）、LRU缓存避免重复下载；
📊 消息处理: 强大的消息格式化、结果验证和提取功能；
🛡️ 错误处理: 完善的LLM重试机制和异常处理；
🎯 电商工具: 内置电商场景专用工具集，提供带验证器的闭环工作流；
- 标题生成：支持长度/单词数约束检查，不合格自动修改，支持程序化缩减；
- 类目预测：支持直接预测和逐级预测两种模式，带JSON格式修复和结果验证；
- 属性填充：支持从候选值中自动验证并填充商品属性；
- HTML生成：自动生成商品描述HTML，自动检测并修复非法标签，支持中文过滤；
- 选项翻译：支持商品选项多语言翻译，自动验证返回列表长度一致性；
📝 流式输出: 支持流式响应，自动转静态处理；
💡 状态保持: 模型实例缓存，避免重复实例化，保持API密钥切换状态。
⏱️ 性能监控: 支持设置耗时警告阈值，监控模型响应性能，并输出响应报告；

安装/更新

pip install --upgrade llmakits

快速开始

1. 配置模型和API密钥

模型配置文件 (config/models_config.yaml):

支持按业务场景分组配置
每个组可以配置多个模型，实现故障转移
模型会按配置顺序依次尝试，直到成功

# 标题生成专用模型组
generate_title:
  - sdk_name: "dashscope"
    model_name: "qwen3-max-preview"

  - sdk_name: "zhipu"
    model_name: "glm-4-plus"

# 翻译专用模型组
translate_box:
  - sdk_name: "modelscope"
    model_name: "Qwen/Qwen3-32B"

  - sdk_name: "modelscope"
    model_name: "deepseek-ai/DeepSeek-V3"

密钥配置文件 (config/keys_config.yaml):

支持多密钥配置，自动负载均衡
当密钥达到每日使用限制时，自动切换到下一个密钥
支持不同平台的独立配置

# 阿里云DashScope平台
dashscope:
  base_url: "https://dashscope.aliyuncs.com/compatible-mode/v1"
  api_keys: ["your-api-key-1", "your-api-key-2"]

# ModelScope平台
modelscope:
  base_url: "https://api-inference.modelscope.cn/v1/"
  api_keys: ["your-api-key-1", "your-api-key-2"]

错误处理和故障转移

模型级别故障转移: 当前模型失败时，自动切换到同组的下一个模型
API密钥用尽检测: 自动检测 API_KEY_EXHAUSTED 异常，并移除对应的模型
结果验证: 支持自定义验证函数，验证失败时自动尝试下一个模型
状态保持: 模型实例在dispatcher中缓存，保持API密钥切换状态

配置优化建议

使用模型组: 推荐使用 execute_with_group 方法，避免重复实例化
合理配置模型顺序: 将性能更好、更稳定的模型放在前面
适当设置重试: 根据业务需求配置模型数量和密钥数量
监控切换次数: 通过 model_switch_count 监控模型切换频率

全局模型配置

详见 doc/global_model_config.md。

2. 加载模型

from llmakits import load_models

# 方式1：传入配置文件路径（字符串）
models = load_models('config/models_config.yaml', 'config/keys_config.yaml')

# 方式2：直接传入配置字典
models_config = {
    "my_models": [
        {"model_name": "gpt-3.5-turbo", "sdk_name": "openai"}
    ]
}
model_keys = {
    "openai": {
        "base_url": "https://api.openai.com/v1",
        "api_keys": ["your-api-key"]
    }
}
models = load_models(models_config, model_keys)

# 方式3：使用全局配置（支持高级参数配置）
models = load_models(
    'config/models_config.yaml',
    'config/keys_config.yaml',
    global_config='config/global_model_config.csv'  # 可选：全局模型配置
)

# 获取模型组
my_models = models['my_models']

3. 发送消息（多模型调度）

使用 ModelDispatcher（推荐）

ModelDispatcher 提供了两种使用方式，推荐使用 execute_with_group 方法：

方式一：使用模型组（execute_with_group）

from llmakits import ModelDispatcher

# 创建调度器实例并加载配置
dispatcher = ModelDispatcher('config/models_config.yaml', 'config/keys_config.yaml')

# 准备消息
message_info = {
    "system_prompt": "你是一个 helpful 助手",
    "user_text": "请介绍一下Python编程语言"
}

# 使用模型组执行任务 - 自动管理模型状态和故障转移
result, tokens = dispatcher.execute_with_group(message_info, group_name="generate_title")
print(f"结果: {result}")
print(f"使用token数: {tokens}")
print(f"模型切换次数: {dispatcher.model_switch_count}")

消息格式说明

message_info 参数支持以下字段：

system_prompt: 系统提示词（可选）
user_text: 用户输入文本（可选）
include_img: 是否包含图片（可选，默认False）
img_list: 图片URL列表（可选，默认为空列表）

基本使用示例：

# 简单文本对话
message_info = {
    "system_prompt": "你是一个 helpful 助手",
    "user_text": "请介绍一下Python编程语言"
}

# 带图片的对话
message_info = {
    "system_prompt": "你是一个图像分析专家",
    "user_text": "请分析这张图片",
    "include_img": True,
    "img_list": ["https://example.com/image.jpg"]
}
# 如果include_img = True 同时 img_list 是空的，此时会报出错误。

方式二：手动传入模型列表（execute_task）

from llmakits import ModelDispatcher

# 创建调度器实例
dispatcher = ModelDispatcher()

# 准备消息和模型列表
message_info = {
    "system_prompt": "你是一个 helpful 助手",
    "user_text": "请介绍一下Python编程语言"
}

# 执行任务
result, tokens = dispatcher.execute_task(message_info, my_models)

高级用法

增强版调度策略：dispatcher_with_repair

from llmakits import dispatcher_with_repair

# 创建调度器
from llmakits import ModelDispatcher
dispatcher = ModelDispatcher('config/models_config.yaml', 'config/keys_config.yaml')

# 准备消息
message_info = {
    "system_prompt": "你是一个JSON数据生成专家",
    "user_text": "请生成一个包含产品信息的JSON对象"
}

# 使用增强版调度策略 - 自动修复JSON错误
try:
    result, tokens = dispatcher_with_repair(
        dispatcher=dispatcher,
        message_info=message_info,
        group_name="generate_json",  # 主模型组名称
        validate_func=None,  # 可选：自定义验证函数
        fix_json_config={
            "group_name": "fix_json",  # 修复模型组名称
            "system_prompt": "你是一个JSON修复专家，请修复下面错误的JSON格式",
            "example_json": '{"name": "产品名称", "price": 99.99}'  # 可选：JSON示例
        }
    )
    print(f"修复后的结果: {result}")
    print(f"使用token数: {tokens}")
except Exception as e:
    print(f"所有模型和修复尝试均失败: {e}")

增强版调度策略特点：

自动修复JSON错误：当主模型返回格式错误的JSON时，自动调用修复模型组进行修复
多模型支持：每个失败的模型都会尝试修复，确保所有主模型都有机会尝试
独立修复流程：使用独立的修复调度器，避免状态混乱
详细错误处理：区分JSON错误和其他类型错误，采取不同的处理策略

使用场景：

需要生成结构化JSON数据的任务
对JSON格式要求严格的场景
希望提高任务成功率的自动化流程

4. 直接使用模型客户端

from llmakits import BaseOpenai

# 创建模型客户端
model = BaseOpenai(
    platform="openai",
    base_url="https://api.openai.com/v1",
    api_keys=["your-api-key"],
    model_name="gpt-3.5-turbo"
)

# 方法1: 使用消息列表格式（兼容OpenAI格式）
messages = [
    {"role": "system", "content": "你是一个 helpful 助手"},
    {"role": "user", "content": "Hello!"}
]
result, tokens = model.send_message(messages)
print(f"回复: {result}")

# 方法2: 使用message_info格式（推荐）
message_info = {
    "system_prompt": "你是一个 helpful 助手",
    "user_text": "Hello!"
}
result, tokens = model.send_message([], message_info)
print(f"回复: {result}")

高级配置选项

from llmakits import BaseOpenai

# 创建带高级配置的客户端
client = BaseOpenai(
    platform="openai",
    base_url="https://api.openai.com/v1",
    api_keys=["your-api-key"],
    model_name="gpt-4o",
    stream=True,              # 启用流式输出
    stream_real=False,        # 真实流式输出
    request_timeout=60,       # 请求超时时间（秒）
    max_retries=3            # 最大重试次数
)

获取模型信息

# 获取模型列表（DataFrame格式，包含创建时间等信息）
models_df = client.models_df()
print(f"模型列表:")
print(models_df)

高级功能

JSON字符串转换，字段提取

from llmakits.message import extract_field, convert_to_json

# 提取并转换为JSON
json_str = '{"name": "test"} some text'
result = convert_to_json(json_str)

# 提取字段
field_value = extract_field(json_str, "name")
print(field_value)  # 输出: test

# 提取多个字段
name, age = extract_field(json_str, "name", "age")
print(name)  # 输出: test
print(age)  # 输出: None

电商工具

详见 doc/e_commerce.md。

功能	说明
基础工具函数	中文字符检测、字符长度检测、HTML 验证
优化商品标题	支持长度/单词数约束检查，不合格自动修改
预测商品类目	直接预测，支持 JSON 修复
梯度预测商品类目	逐级预测，支持 JSON 修复
翻译商品选项	多语言翻译，自动验证返回列表长度一致性
生成 HTML 商品描述	自动生成 HTML，自动检测并修复非法标签
填充属性值	从候选值中自动验证并填充商品属性

许可证

Apache 2.0 License

Project details

These details have not been verified by PyPI

Project links

Release history Release notifications | RSS feed

This version

0.6.54

May 5, 2026

0.6.53

May 4, 2026

0.6.52

May 4, 2026

0.6.51

Apr 30, 2026

0.6.50

Apr 26, 2026

0.6.49

Apr 20, 2026

0.6.47

Apr 10, 2026

0.6.46

Apr 10, 2026

0.6.45

Apr 10, 2026

0.6.44

Apr 9, 2026

0.6.43

Apr 9, 2026

0.6.42

Apr 9, 2026

0.6.41

Apr 8, 2026

0.6.40

Apr 8, 2026

0.6.39

Apr 7, 2026

0.6.38

Apr 7, 2026

0.6.37

Apr 7, 2026

0.6.36

Apr 7, 2026

0.6.35

Apr 6, 2026

0.6.34

Apr 4, 2026

0.6.33

Mar 17, 2026

0.6.32

Mar 1, 2026

0.6.31

Feb 28, 2026

0.6.30

Jan 27, 2026

0.6.29

Jan 27, 2026

0.6.28

Jan 20, 2026

0.6.27

Dec 23, 2025

0.6.26

Dec 7, 2025

0.6.25

Nov 29, 2025

0.6.24

Nov 27, 2025

0.6.23

Nov 18, 2025

0.6.22

Nov 18, 2025

0.6.21

Nov 14, 2025

0.6.20

Nov 12, 2025

0.6.19

Nov 12, 2025

0.6.18

Nov 11, 2025

0.6.17

Nov 10, 2025

0.6.16

Nov 10, 2025

0.6.15

Nov 3, 2025

0.6.14

Oct 28, 2025

0.6.13

Oct 22, 2025

0.6.12

Oct 21, 2025

0.6.11

Oct 21, 2025

0.6.10

Oct 21, 2025

0.6.9

Oct 21, 2025

0.6.8

Oct 20, 2025

0.6.7

Oct 19, 2025

0.6.6

Oct 18, 2025

0.6.5

Oct 18, 2025

0.6.4

Oct 18, 2025

0.6.3

Oct 17, 2025

0.6.2

Oct 17, 2025

0.6.1

Oct 17, 2025

0.6.0

Oct 17, 2025

0.5.9

Oct 17, 2025

0.5.8

Oct 17, 2025

0.5.7

Oct 16, 2025

0.5.6

Oct 16, 2025

0.5.5

Oct 16, 2025

0.5.4

Oct 15, 2025

0.5.3

Oct 14, 2025

0.5.2

Oct 14, 2025

0.5.1

Oct 13, 2025

0.5.0

Oct 13, 2025

0.4.9

Oct 12, 2025

0.4.8

Oct 12, 2025

0.4.7

Oct 12, 2025

0.4.6

Oct 12, 2025

0.4.5

Oct 10, 2025

0.4.4

Oct 9, 2025

0.4.3

Oct 9, 2025

0.4.2

Oct 9, 2025

0.4.1

Oct 9, 2025

0.4.0

Oct 9, 2025

0.3.9

Oct 3, 2025

0.3.8

Oct 3, 2025

0.3.7

Oct 2, 2025

0.3.6

Oct 1, 2025

0.3.5

Oct 1, 2025

0.3.4

Oct 1, 2025

0.3.3

Oct 1, 2025

0.3.2

Sep 30, 2025

0.3.1

Sep 29, 2025

0.3.0

Sep 29, 2025

0.2.9

Sep 29, 2025

0.2.8

Sep 29, 2025

0.2.7

Sep 29, 2025

0.2.6

Sep 28, 2025

0.2.5

Sep 28, 2025

0.2.4

Sep 28, 2025

0.2.3

Sep 27, 2025

0.2.2

Sep 27, 2025

0.2.1

Sep 27, 2025

0.2.0

Sep 22, 2025

0.1.9

Sep 22, 2025

0.1.8

Sep 22, 2025

0.1.7

Sep 21, 2025

0.1.6

Sep 20, 2025

0.1.5

Sep 20, 2025

0.1.4

Sep 19, 2025

0.1.3

Sep 19, 2025

0.1.2

Sep 18, 2025

0.1.1

Sep 18, 2025

0.1.0

Sep 18, 2025

Download files

Download the file for your platform. If you're not sure which to choose, learn more about installing packages.

Source Distribution

llmakits-0.6.54.tar.gz (55.0 kB view details)

Uploaded May 5, 2026 Source

Built Distribution

If you're not sure about the file name format, learn more about wheel file names.

The dropdown lists show the available interpreters, ABIs, and platforms. Enable javascript to be able to filter the list of wheel files.

llmakits-0.6.54-py3-none-any.whl (62.4 kB view details)

Uploaded May 5, 2026 Python 3

File details

Details for the file llmakits-0.6.54.tar.gz.

File metadata

Download URL: llmakits-0.6.54.tar.gz
Upload date: May 5, 2026
Size: 55.0 kB
Tags: Source
Uploaded using Trusted Publishing? No
Uploaded via: twine/6.2.0 CPython/3.14.4

File hashes

Hashes for llmakits-0.6.54.tar.gz
Algorithm	Hash digest
SHA256	`94b9868b2e9cea7e2c6da8282603040ce1d2118676864b454cd17ebcda2994c9`
MD5	`086b47b5dc8148ae04b8d006c880d891`
BLAKE2b-256	`d80343caa4e7fc51c87e36aac80217c285dc09e51bbc4385e03c394b07fff9d1`

See more details on using hashes here.

File details

Details for the file llmakits-0.6.54-py3-none-any.whl.

File metadata

Download URL: llmakits-0.6.54-py3-none-any.whl
Upload date: May 5, 2026
Size: 62.4 kB
Tags: Python 3
Uploaded using Trusted Publishing? No
Uploaded via: twine/6.2.0 CPython/3.14.4

File hashes

Hashes for llmakits-0.6.54-py3-none-any.whl
Algorithm	Hash digest
SHA256	`fefd4d1d3c1f64c6c4d10a1e73e8eb4232e801cd22f164f4ee5afaff6f69d16e`
MD5	`61211e2e842eb40aa331bd102f042a2a`
BLAKE2b-256	`b5cdf4cfbe8f5657724b1bcc1b304910369694d6c1fd13abc34f3104fc7582b5`

See more details on using hashes here.

llmakits 0.6.54

Navigation

Verified details

Maintainers

Unverified details

Project links

Meta

Classifiers

Project description

llmakits

功能特性

安装/更新

快速开始

1. 配置模型和API密钥

错误处理和故障转移

配置优化建议

全局模型配置

2. 加载模型

3. 发送消息（多模型调度）

使用 ModelDispatcher（推荐）

消息格式说明

高级用法

增强版调度策略：dispatcher_with_repair

4. 直接使用模型客户端

高级配置选项

获取模型信息

高级功能

JSON字符串转换，字段提取

电商工具

许可证

Project details

Verified details

Maintainers

Unverified details

Project links

Meta

Classifiers

Release history Release notifications | RSS feed

Download files

Source Distribution

Built Distribution

File details

File metadata

File hashes

File details

File metadata

File hashes