Skip to main content

Agentica: A lightweight Python SDK for building AI agents with persistent memory and self-evolution

Project description

🇨🇳中文 | 🌐English | 🇯🇵日本語


Agentica: Build AI Agents

PyPI version Downloads License Apache 2.0 python_version GitHub issues Wechat Group

Agentica 不是套一层 LLM API 的聊天壳,而是一个 Async-First 的 agent harness。 它让 Agent 能真正跑起来: 调工具、跑长任务、做多智能体协作、跨会话保留记忆,并通过 Skill system 接入可演进的 self-learn 工作流。

能力 说明
Long-running Agent Loop Runner 驱动的 LLM ↔ Tool 循环,内置压缩、重试、成本预算、死循环防护
Works Beyond Chat 文件、执行、搜索、浏览器、MCP、多智能体、Workflow,不依附单一 IDE 场景
Memory That Survives Sessions Workspace 记忆按条目存储、相关性召回,并可把确认过的偏好同步到 ~/.agentica/AGENTS.md
Skill-Based Self-Learn SkillTool 可加载外部技能;内置 Agent 持续学习策略
Open, Composable Harness 模型、工具、记忆、Skill、Guardrails、MCP 都是可替换部件,而不是封闭 SaaS 黑盒

架构

Agentica 提供了从底层模型路由到顶层多智能体协作的完整抽象:

Agentica Architecture

核心执行引擎 (Agentic Loop)

Agentica 的单体 Agent 运行在一个纯粹的基于控制流的 while(true) 引擎中,严格依据工具调用来驱动,并内置了防死循环、成本追踪、上下文微压缩(Compaction)和四层安全护栏:

Agentica Loop Architecture

安装

pip install -U agentica

快速开始

不用学 asyncio 也能跑。run_sync 在内部跑完整 agentic loop(工具并发、流式、压缩、重试都在),从外面看就是一个普通同步函数:

from agentica import Agent, OpenAIChat

agent = Agent(model=OpenAIChat(id="gpt-4o-mini"))
result = agent.run_sync("一句话介绍北京")
print(result.content)
北京是中国的首都,是一座拥有三千多年历史的文化名城,也是全国的政治、文化和国际交流中心。

需要先设置 API Key:

export OPENAI_API_KEY="sk-xxx"              # OpenAI
export ZHIPUAI_API_KEY="your-api-key"       # 智谱AI(glm-4.7-flash 免费)
export DEEPSEEK_API_KEY="your-api-key"      # DeepSeek

同步 vs 异步

你的代码风格 推荐 API
普通脚本 / Jupyter / FastAPI 路由(默认) agent.run_sync(...)agent.print_response_sync(...)for chunk in agent.run_stream_sync(...)
已经在 asyncio 事件循环里 / 想 gather N 个 agent 并发 await agent.run(...)async for chunk in agent.run_stream(...)

run_sync 内部就是 asyncio.run(self.run(...)),工具调用层用 asyncio.gather 并发——同步 API 不会牺牲性能,只是把事件循环藏起来了。

import asyncio
from agentica import Agent, OpenAIChat

async def main():
    agent = Agent(model=OpenAIChat(id="gpt-4o-mini"))
    result = await agent.run("一句话介绍上海")
    print(result.content)

asyncio.run(main())

推荐导入方式

核心 SDK + 内置工具都已经顶层导出,不用记长路径:

from agentica import (
    Agent, DeepAgent, Workspace, tool,
    OpenAIChat,                                       # openai 是核心依赖
    BuiltinFileTool, BuiltinExecuteTool,              # 文件 / 执行
    BuiltinFetchUrlTool, BuiltinWebSearchTool,        # 网页
    BuiltinTodoTool, BuiltinTaskTool,                 # 任务清单 / 子 Agent
    HistoryConfig, WorkspaceMemoryConfig, RunConfig,  # 配置
)

# 其他模型 / 重型工具走子模块(避免启动时拉重依赖)
from agentica.model.anthropic.claude import Claude   # pip install anthropic
from agentica.model.ollama.chat import Ollama
from agentica.tools.shell_tool import ShellTool

功能特性

  • Async-First — 原生 async API,asyncio.gather() 并行工具执行,同步适配器兼容
  • Runner Agentic Loop — LLM ↔ 工具调用自动循环,多轮链式推理、死循环检测、成本预算、压缩 pipeline、API 重试
  • 20+ 模型 — OpenAI / DeepSeek / Claude / 智谱 / Qwen / Moonshot / Ollama / LiteLLM 等
  • 40+ 内置工具 — 搜索、代码执行、文件操作、浏览器、OCR、图像生成
  • RAG — 知识库管理、混合检索、Rerank,集成 LangChain / LlamaIndex
  • 多智能体Agent.as_tool()(轻量组合)、Swarm(并行/自治)和 Workflow(确定性编排)
  • 安全守卫 — 输入/输出/工具级 Guardrails,流式实时检测
  • MCP / ACP — Model Context Protocol 和 Agent Communication Protocol 支持
  • Skill 系统 — 基于 Markdown 的技能注入,支持项目级、用户级和外部托管 skill 目录
  • 多模态 — 文本、图像、音频、视频理解
  • 持久化记忆 — 索引/内容分离、相关性召回、四类型分类、drift 防御,并可同步长期偏好到全局 AGENTS.md

Workspace 记忆

Workspace 提供跨会话的持久化记忆,采用索引/召回设计;需要时还可以把确认过的用户/反馈记忆编译进全局 ~/.agentica/AGENTS.md,让新 session 自动继承:

from agentica import Workspace

workspace = Workspace("./workspace")
workspace.initialize()

# 写入带类型的记忆条目(每条独立文件,自动更新索引)
await workspace.write_memory_entry(
    title="Python Style",
    content="User prefers concise, typed Python.",
    memory_type="feedback",              # user|feedback|project|reference
    description="python coding style",   # 相关性匹配关键词
    sync_to_global_agent_md=True,        # 同步到 ~/.agentica/AGENTS.md 的 Learned Preferences 区块
)

# 相关性召回(根据当前 query 返回最相关的 ≤5 条)
memory = await workspace.get_relevant_memories(query="how to write python")

Agent 自动根据当前 query 召回最相关记忆,而非全量注入:

from agentica import DeepAgent, Workspace
from agentica.agent.config import WorkspaceMemoryConfig

agent = DeepAgent(
    workspace=Workspace("./workspace"),
    long_term_memory_config=WorkspaceMemoryConfig(
        max_memory_entries=5,  # 最多注入 5 条相关记忆
        sync_memories_to_global_agent_md=True,
    ),
)

DeepAgent 默认启用 SkillTool(auto_load=True),会自动发现 ~/.agentica/skills/.agentica/skills/ 目录下的 skill;同时默认开启 tool_config.auto_load_mcp=True,启动时会自动读取工作目录里的 mcp_config.json/yaml/yml。这样 DeepAgent 开箱就是带 skills + MCP + memory 的一键完全体。

Agent 配方(Recipes)

Agent 参数多,但常用组合就那几个。直接 copy-paste:

一次性脚本(最简)

agent = Agent(model=OpenAIChat(id="gpt-4o-mini"))
print(agent.run_sync("一句话介绍北京").content)

多轮对话

agent = Agent(
    model=OpenAIChat(id="gpt-4o-mini"),
    add_history_to_context=True,
    num_history_turns=5,
)
agent.run_sync("我叫 Alice,是 ML 工程师。")
agent.run_sync("我叫什么?")  # 模型记得

工具型 Agent(自定义工具组合)

from agentica import Agent, OpenAIChat, BuiltinWebSearchTool, BuiltinFileTool, BuiltinExecuteTool

agent = Agent(
    model=OpenAIChat(id="gpt-4o-mini"),
    tools=[BuiltinWebSearchTool(), BuiltinFileTool(work_dir="./workspace"), BuiltinExecuteTool(work_dir="./workspace")],
)
agent.run_sync("帮我搜 Python 3.13 新特性,写到 features.md")

多用户 + 长期记忆 + 会话归档

每个用户一个 Agent 实例,session_id 一般直接复用 user_id

from agentica import Agent, OpenAIChat, Workspace, WorkspaceMemoryConfig

def create_agent(user_id: str) -> Agent:
    return Agent(
        model=OpenAIChat(id="gpt-4o-mini"),
        workspace=Workspace("~/.agentica/workspace", user_id=user_id),
        session_id=user_id,                      # 会话日志按 user 切到 ~/.agentica/projects/.../{user_id}.jsonl
        enable_long_term_memory=True,            # ← 关键:必须显式开启
        long_term_memory_config=WorkspaceMemoryConfig(
            auto_archive=True,                   # 每次 run 后归档对话
            auto_extract_memory=True,            # LLM 自动抽取记忆
        ),
        add_history_to_context=True,
        num_history_turns=5,
    )

常见踩坑:只配 long_term_memory_config 但忘了 enable_long_term_memory=True,所有记忆/归档都会被静默忽略。从 v1.3.7 起 Agent.__init__ 会在这种情况下打 warning,但请直接按上面写就不会踩。

长会话省 token:定制历史消息

搜索类工具结果通常巨大且后续轮次用不上,可以在历史里删掉;AI 回复可以截断:

from agentica import Agent, OpenAIChat, HistoryConfig

agent = Agent(
    model=OpenAIChat(id="gpt-4o-mini"),
    add_history_to_context=True,
    num_history_turns=10,
    history_config=HistoryConfig(
        excluded_tools=["search_*", "web_search"],   # 整条 tool 结果丢掉,对应的 tool_calls 自动同步剥离
        assistant_max_chars=200,                      # AI 回复截断到 200 字
    ),
)

更复杂的过滤(剥用户 prompt 前缀、按 metadata 删消息等)用 history_filter 回调,看 examples/memory/03_history_filter.py

完全体(CLI / Gateway / 长任务)

from agentica import DeepAgent
agent = DeepAgent()  # 40+ 内置工具 + 压缩 + 长期记忆 + skills + MCP,开箱即用

CLI

agentica --model_provider zhipuai --model_name glm-4.7-flash

安装外部 skill 集合时,推荐使用新的 skills 命令

agentica skills install https://github.com/obra/superpowers
agentica skills list
agentica skills remove learn-from-experience
agentica skills reload

如果你已经进入交互式 CLI,也可以直接在会话里安装、查看和卸载 skills:

> /skills install https://github.com/obra/superpowers
> /skills list
> /skills inspect learn-from-experience
> /skills remove learn-from-experience
> /skills reload

也支持安装本地目录或指定目标目录:

agentica skills install /path/to/skill-repo --target-dir ~/.agentica/skills

如果你安装到自定义目录而不是标准搜索路径,记得把这个目录加入 AGENTICA_EXTRA_SKILL_PATH,这样 DeepAgent 和 CLI 才会自动发现它。

Web UI / Gateway

Gateway 现在已经集成到 agentica 主库中

安装 Gateway 运行时:

pip install -U "agentica[gateway]"

设置一个最小可运行配置后直接启动:

export AGENTICA_MODEL_PROVIDER=zhipuai
export AGENTICA_MODEL_NAME=glm-4.7-flash
export GATEWAY_TOKEN=change-me
agentica-gateway

默认会启动在 http://127.0.0.1:8789/chat。如需改监听地址,可设置 HOSTPORT;如需接入 Telegram / Discord / Slack,可分别安装 agentica[telegram]agentica[discord]agentica[slack]

Gateway 内置了 Web UI、API、WebSocket、cron scheduler,以及飞书 / Telegram / Discord 等 channel 接入能力,适合把 agentica 从本地 CLI 扩展到常驻服务。

示例

查看 examples/ 获取完整示例,涵盖:

类别 内容
基础用法 Hello World、流式输出、结构化输出、多轮对话、多模态、Agentic Loop 对比
工具 自定义工具、Async 工具、搜索、代码执行、并行工具、并发安全、成本追踪、沙箱隔离、压缩
Agent 模式 Agent 作为工具、并行执行、团队协作、辩论、路由分发、Swarm、子 Agent、模型层钩子、会话恢复
安全护栏 输入/输出/工具级 Guardrails、流式护栏
记忆 会话历史、WorkingMemory、上下文压缩、Workspace 记忆、LLM 自动记忆
RAG PDF 问答、高级 RAG、LangChain / LlamaIndex 集成
工作流 数据管道、投资研究、新闻报道、代码审查
MCP Stdio / SSE / HTTP 传输、JSON 配置
可观测性 Langfuse、Token 追踪、Usage 聚合
应用 LLM OS、深度研究、客服系统、金融研究(6-Agent 流水线)

→ 查看完整示例目录

文档

完整使用文档:https://shibing624.github.io/agentica

社区与支持

  • GitHub Issues提交 issue
  • 微信群 — 添加微信号 xuming624,备注 "llm",加入技术交流群

引用

如果您在研究中使用了 Agentica,请引用:

Xu, M. (2026). Agentica: A Human-Centric Framework for Large Language Model Agent Workflows. GitHub. https://github.com/shibing624/agentica

许可证

Apache License 2.0

贡献

欢迎贡献!请查看 CONTRIBUTING.md

致谢

Project details


Download files

Download the file for your platform. If you're not sure which to choose, learn more about installing packages.

Source Distribution

agentica-1.4.1.tar.gz (653.0 kB view details)

Uploaded Source

Built Distribution

If you're not sure about the file name format, learn more about wheel file names.

agentica-1.4.1-py3-none-any.whl (767.3 kB view details)

Uploaded Python 3

File details

Details for the file agentica-1.4.1.tar.gz.

File metadata

  • Download URL: agentica-1.4.1.tar.gz
  • Upload date:
  • Size: 653.0 kB
  • Tags: Source
  • Uploaded using Trusted Publishing? No
  • Uploaded via: twine/6.1.0 CPython/3.12.5

File hashes

Hashes for agentica-1.4.1.tar.gz
Algorithm Hash digest
SHA256 b4be28074e34041f6678ab085891869027e6fa7a1bb6a36e15cd369d7f5376d5
MD5 9df61044d9b9978709b0632f124f1ccd
BLAKE2b-256 01b729688ccd292caf90e8d76c0fc044d91006c0fc5fcbc7cdc9cf9aeacc5138

See more details on using hashes here.

File details

Details for the file agentica-1.4.1-py3-none-any.whl.

File metadata

  • Download URL: agentica-1.4.1-py3-none-any.whl
  • Upload date:
  • Size: 767.3 kB
  • Tags: Python 3
  • Uploaded using Trusted Publishing? No
  • Uploaded via: twine/6.1.0 CPython/3.12.5

File hashes

Hashes for agentica-1.4.1-py3-none-any.whl
Algorithm Hash digest
SHA256 66f1372b77d11277ef93dfdcbc2991d5cfd486804b22a61522de5f549633d000
MD5 3c816efc583ad01e3ce0f716b64ebf6d
BLAKE2b-256 f6a639fd275ef50d2271a28a39ce99c632ad5b14e3697900356cf7286501cfc5

See more details on using hashes here.

Supported by

AWS Cloud computing and Security Sponsor Datadog Monitoring Depot Continuous Integration Fastly CDN Google Download Analytics Pingdom Monitoring Sentry Error logging StatusPage Status page