Session handoff & persistent memory for AI Agents — Ebbinghaus decay, hybrid retrieval (BM25+vector+graph), engineering state tracking, auto-consolidation. Local-first, zero cloud dependency.

These details have not been verified by PyPI

Project links

Project description

Engram

Every task leaves a trace.

Engram 是一个面向 AI Agent 的会话接力与记忆系统，让任务可以跨会话、跨 Agent 持续推进，而不是每次从零开始。

它本地运行，提供记忆检索、会话交接、工程状态管理和自动整理能力。

🚨 The Real Problem

AI Agent 已经很强，但在真实工程中有三个致命问题：

跨会话直接"失忆"，任务中断
重复犯同样的错误（API 误用 / 逻辑偏差）
上下文越堆越大，最后直接崩掉

这不是模型问题，而是：

Context & State Management 问题

✅ What Engram Solves

Engram 不只是"记忆存储"。它解决的是：

1. 会话接力（Session Handoff）

让任务可以在不同 Agent / 不同时间点继续执行

2. 上下文压缩（Context Compression）

从长对话中提取"可执行状态"，避免 token 爆炸

3. 工程状态管理（Engineering State）

记录错误、进度、决策，而不是只存对话

🧠 Core Idea

Don't store conversations. Store what matters for the next step.

🔥 Core Capabilities

🧩 Persistent Memory

存储事实、偏好、决策
支持语义检索 + BM25 关键词检索 + 图谱关联扩展
混合评分：0.3 × BM25 + 0.7 × (语义相似度 × 衰减强度) + 图谱加成

🔄 Session Handoff（核心能力）

结构化记录：

{
  "summary": "任务目标与当前状态",
  "completed": ["已完成项"],
  "in_progress": ["进行中"],
  "blocked": ["阻塞项"],
  "next_steps": ["下一步行动"]
}

👉 新 Agent 接手时，不需要读历史对话，直接继续执行

🛠 Engineering State

不仅记"发生了什么"，还记：

track_failure：错误原因 + 根因 + 组件 + 严重级 + 修复方式
track_progress：模块进度 / 阻塞 / 质量评分
update_memory：状态更新

👉 本质是把"测试经验"和"开发上下文"结构化

🧹 Auto Maintenance

系统自动：

去重（Deduplication）— 相似度 ≥ 0.85 只增加回忆次数
矛盾消解（Conflict Resolution）— 检测到矛盾自动替换
衰减（Decay）— 艾宾浩斯遗忘曲线，自然淘汰过时信息
整合（Consolidation）— 相似度 ≥ 0.70 的记忆簇自动合并
剪枝（Pruning）— 强度 < 0.05 且无链式保护的记忆自动删除

避免 memory 无限膨胀，零运维。

⚙️ Architecture

┌──────────────────────────────────────────────┐
│              MCP Client                      │
│      (Claude Code / Cursor / ...)            │
└──────────────────┬───────────────────────────┘
                   │ stdio / HTTP
┌──────────────────▼───────────────────────────┐
│         shared.py (单例 + 分发)               │
│    server.py (stdio)  ·  http_server.py      │
│              8 MCP tools · APScheduler       │
├──────────────────────────────────────────────┤
│  ┌─ 写入路径 ──────┐  ┌─ 读取路径 ──────┐    │
│  │  resolve.py     │  │  retrieve.py    │    │
│  │  去重/矛盾消解   │  │  混合检索+评分   │    │
│  └─────────────────┘  └─────────────────┘    │
│                                              │
│  ┌─ 维护路径 ──────┐  ┌─ 统计路径 ──────┐    │
│  │  consolidator   │  │  decay.py       │    │
│  │  聚类合并+剪枝   │  │  遗忘曲线+强度   │    │
│  └─────────────────┘  └─────────────────┘    │
│                                              │
├──────────────────────────────────────────────┤
│  embedding.py          │  graph.py           │
│  768d 向量编码+降级     │  NetworkX 语义图谱  │
├──────────────────────────────────────────────┤
│              db.py — DuckDB                  │
│  向量存储  ·  BM25 FTS  ·  CRUD             │
└──────────────────────────────────────────────┘

数据文件（~/.engram/）：
├── memories.duckdb     # 向量数据库（单文件，零运维）
├── graph.json          # 语义图谱（JSON 序列化）
└── model_cache/        # 嵌入模型缓存

技术特点：

单机本地运行（隐私 + 可控）
DuckDB 单文件存储，BM25 FTS 索引自动维护
双传输层：MCP stdio + HTTP/REST
NetworkX 语义关系图，BFS 扩展联想发现
定时自动维护（12h 周期：整合 + 剪枝 + FTS 重建）

🧠 记忆机制

艾宾浩斯遗忘曲线

每条记忆都有一个强度值（strength），随时间按指数曲线衰减：

effective_λ = base_λ × (1 - importance × 0.8)
strength = importance × e^(-λ × days) × (1 + recall_count × 0.2)

类别	衰减率 λ	半衰期	适用场景
`strategy`	0.10	~38 天	被验证有效的方法论、架构模式
`fact`	0.16	~24 天	用户偏好、身份信息、技术选型
`assumption`	0.20	~19 天	推断的上下文、不确定的信息
`failure`	0.35	~11 天	踩过的坑、环境问题、临时 workaround

设计意图：成功的策略记最久（strategy ~38天），失败的教训记最短（failure ~11天）——环境会变，昨天的坑明天可能已经填上了。

智能去重与矛盾消解

相似度 ≥ 0.85 → REINFORCE  只增加回忆次数
相似度 0.65~0.84 → 检测矛盾
  ├── 语义矛盾 → REPLACE   用新内容覆盖
  └── 语义兼容 → MERGE     合并为更完整的记忆
相似度 < 0.65 → NEW        存为新记忆

语义图谱

每条记忆存入时自动与已有记忆建立语义关联（相似度 ≥ 0.40 建边），检索时从命中记忆出发做 BFS（最大深度 2）发现关联知识。链式保护机制确保作为"桥梁"的弱记忆不被误删。

🚀 Quick Start

# 安装
pip install mcp-engram

# 初始化（下载模型、创建数据库）
engram-setup

# 按照输出提示将配置块添加到 Claude Code 配置中

Claude Code 配置

{
  "mcpServers": {
    "engram": {
      "command": "engram",
      "env": {
        "HF_ENDPOINT": "https://hf-mirror.com"
      }
    }
  }
}

CLAUDE.md 集成

## Memory Rules

### Step 1 — 先回忆再行动
每次任务开始时，用请求中的关键词调用 `recall_memory`。

### Step 2 — 学到新东西就存
| 情况 | 操作 |
|------|------|
| 全新知识 | `store_memory(content, importance)` |
| 补充已有 | `update_memory(memory_id, merged_content)` |
| 推翻已有 | `update_memory(memory_id, new_content)` |

🧰 MCP Tools

工具	参数	用途
`recall_memory`	`query`, `user_id?`, `top_k?`	语义检索记忆
`store_memory`	`content`, `importance`, `category?`, `metadata?`, `user_id?`	存储新记忆（自动去重）
`update_memory`	`memory_id`, `new_content`, `importance?`	更新已有记忆
`session_handoff`	`summary`, `completed?`, `in_progress?`, `blocked?`, `next_steps?`, `user_id?`	结构化会话交接
`track_failure`	`error`, `component`, `root_cause?`, `severity?`, `fix?`, `related_test_ids?`, `user_id?`	结构化失败归因
`track_progress`	`feature`, `status`, `completion?`, `blockers?`, `quality_score?`, `notes?`, `user_id?`	功能进度快照
`consolidate_memory`	`user_id?`	手动触发记忆整合
`memory_stats`	`user_id?`	记忆统计 + 工程指标

重要性参考

值	使用场景
0.9–1.0	核心身份、永久事实
0.7–0.8	强偏好、架构决策
0.5	普通项目事实
0.2–0.3	临时会话上下文

🔍 What Makes Engram Different

普通 memory 系统：

存文本 → 检索文本

Engram：

存状态 → 驱动下一步执行

区别在于：

有会话交接而不是仅检索
有工程状态而不是仅知识
有自动整理而不是无限增长
本地优先，零云端依赖，数据永远在你的机器上

🧪 Benchmark

基于 LoCoMo（Snap Research 长期对话记忆基准）的评测。

Turn Mode — 最佳配置（bge-m3 + reranker, DeepSeek-V3.2）

Category	Count	F1	Hit@5
Single-Hop	114	0.5121	76.3%
Temporal	63	0.4501	95.2%
Multi-Hop	43	0.3181	60.5%
Open-Domain	13	0.1324	61.5%
Overall	233	0.4383	77.7%

优化路径

配置	Overall F1	Overall Hit@5
bge-m3 + reranker + weight fix	0.4383	77.7%
bge-m3 + reranker (r20)	0.3913	69.1%
bge-m3 (API, 1024d)	0.3514	61.8%
all-mpnet-base-v2 (local, 768d)	0.2916	51.5%

四轮优化累计 F1 +50.3%，Hit@5 +26.2pp。

与业界基线对比

System	Overall F1	LLM
MemMachine	0.8487	GPT-4o-mini
Memobase	0.7578	GPT-4o-mini
Zep	0.7514	GPT-4o-mini
Mem0	0.6688	GPT-4o-mini
Engram	0.4383	DeepSeek-V3.2

本地部署零云端依赖，与 Mem0 差距从 56% 缩小到 35%。

🎯 Use Cases

AI Coding Agent

记住项目约定，避免重复 bug
追踪重构进度，跨会话持续

多 Agent 协作

Agent A → Agent B 无缝交接
避免重复分析

长任务执行

防止 context 爆炸
保持任务连续性

🧭 Design Principles

Memory 是"执行上下文"，不是日志
会话交接比历史记录更重要
错误应该被结构化，而不是遗忘
本地优先，保证可控性

🔧 环境变量

变量	默认值	说明
`HF_ENDPOINT`	`https://hf-mirror.com`	HuggingFace 模型镜像地址
`ENGRAM_MODEL`	`all-mpnet-base-v2`	嵌入模型名称
`ENGRAM_MODEL_TIMEOUT`	`30`	模型加载超时（秒），超时进入降级模式
`ENGRAM_PRUNE_THRESHOLD`	`0.05`	记忆淘汰强度阈值
`ENGRAM_DEDUP_THRESHOLD`	`0.65`	去重相似度下限
`ENGRAM_REINFORCE_THRESHOLD`	`0.85`	强化相似度阈值
`ENGRAM_SIM_HIGH`	`0.50`	检索高阈值
`ENGRAM_SIM_LOW`	`0.20`	检索低阈值
`ENGRAM_REINFORCE_SIM`	`0.75`	检索时强化阈值
`ENGRAM_W_BM25`	`0.30`	BM25 关键词权重
`ENGRAM_W_VECTOR`	`0.70`	向量语义权重
`ENGRAM_GRAPH_DEPTH`	`3`	图谱 BFS 最大深度
`ENGRAM_EDGE_THRESHOLD`	`0.40`	图谱建边相似度阈值
`ENGRAM_MAX_EDGES`	`5`	每条记忆最大边数
`ENGRAM_CONSOLIDATE_THRESHOLD`	`0.70`	整合聚类相似度阈值

🛣 Roadmap

Error-aware Memory（避免重复错误）
Handoff Validation（交接一致性检测）
Eval Pipeline（量化质量提升）
Coding Agent 深度集成（Cursor / Claude）

📌 Final Thought

AI 不缺能力，缺的是"记住并持续执行"的能力。

Engram 解决的不是记忆问题，而是：

让 Agent 的任务可以不中断地往前走

开发

git clone https://github.com/hugfeature/engram.git
cd engram
pip install -e ".[dev]"
pytest tests/ -v

License

MIT

Project details

These details have not been verified by PyPI

Project links

Release history Release notifications | RSS feed

0.19.0

May 20, 2026

0.18.0

May 20, 2026

0.16.1

May 19, 2026

0.16.0

May 19, 2026

0.15.2

May 18, 2026

0.15.1

May 14, 2026

0.15.0

May 14, 2026

0.14.0

May 14, 2026

0.13.2

May 12, 2026

0.13.1

May 9, 2026

0.11.3

May 9, 2026

0.11.2

May 9, 2026

0.11.1

May 9, 2026

0.11.0

May 9, 2026

0.10.0

May 9, 2026

0.9.1

May 9, 2026

0.9.0

May 8, 2026

0.8.2

May 8, 2026

0.8.1

May 8, 2026

0.8.0

May 8, 2026

0.7.0

May 7, 2026

This version

0.6.0

May 7, 2026

0.5.0

May 6, 2026

0.4.5

Apr 30, 2026

0.4.4

Apr 30, 2026

0.4.3

Apr 30, 2026

0.4.0

Apr 30, 2026

0.3.1

Apr 30, 2026

0.2.1

Apr 29, 2026

0.2.0

Apr 29, 2026

0.1.2

Apr 29, 2026

0.1.1

Apr 29, 2026

0.1.0

Apr 29, 2026

Download files

Download the file for your platform. If you're not sure which to choose, learn more about installing packages.

Source Distribution

mcp_engram-0.6.0.tar.gz (53.8 kB view details)

Uploaded May 7, 2026 Source

Built Distribution

If you're not sure about the file name format, learn more about wheel file names.

The dropdown lists show the available interpreters, ABIs, and platforms. Enable javascript to be able to filter the list of wheel files.

mcp_engram-0.6.0-py3-none-any.whl (37.3 kB view details)

Uploaded May 7, 2026 Python 3

File details

Details for the file mcp_engram-0.6.0.tar.gz.

File metadata

Download URL: mcp_engram-0.6.0.tar.gz
Upload date: May 7, 2026
Size: 53.8 kB
Tags: Source
Uploaded using Trusted Publishing? No
Uploaded via: twine/6.2.0 CPython/3.13.7

File hashes

Hashes for mcp_engram-0.6.0.tar.gz
Algorithm	Hash digest
SHA256	`3445adb1d7f50d7eb26e7dc7e2a7e6b05c1ea97f743fd8a79435d0c34f9bf336`
MD5	`6a49718f2faea37dddf7700be9df40db`
BLAKE2b-256	`86c81fc7224d91f42997affb0ce3a68c02f2c8eb3c567bed2bc4fb56e67a6fe0`

See more details on using hashes here.

File details

Details for the file mcp_engram-0.6.0-py3-none-any.whl.

File metadata

Download URL: mcp_engram-0.6.0-py3-none-any.whl
Upload date: May 7, 2026
Size: 37.3 kB
Tags: Python 3
Uploaded using Trusted Publishing? No
Uploaded via: twine/6.2.0 CPython/3.13.7

File hashes

Hashes for mcp_engram-0.6.0-py3-none-any.whl
Algorithm	Hash digest
SHA256	`c77e308c96400ce37cac035b4f7d3aed1bd6e29f8bc19199730e0fa2836b1a19`
MD5	`3ba484e18465ac28e8f09acbc75800a6`
BLAKE2b-256	`e280c59320efe74666a6e6877bb7d56aaf3a18a383ceb02d9eb72ccecb65e01d`

See more details on using hashes here.

mcp-engram 0.6.0

Navigation

Verified details

Maintainers

Unverified details

Project links

Meta

Classifiers

Project description

Engram

🚨 The Real Problem

✅ What Engram Solves

1. 会话接力（Session Handoff）

2. 上下文压缩（Context Compression）

3. 工程状态管理（Engineering State）

🧠 Core Idea

🔥 Core Capabilities

🧩 Persistent Memory

🔄 Session Handoff（核心能力）

🛠 Engineering State

🧹 Auto Maintenance

⚙️ Architecture

🧠 记忆机制

艾宾浩斯遗忘曲线

智能去重与矛盾消解

语义图谱

🚀 Quick Start

Claude Code 配置

CLAUDE.md 集成

🧰 MCP Tools

重要性参考

🔍 What Makes Engram Different

🧪 Benchmark

Turn Mode — 最佳配置（bge-m3 + reranker, DeepSeek-V3.2）

优化路径

与业界基线对比

🎯 Use Cases

AI Coding Agent

多 Agent 协作

长任务执行

🧭 Design Principles

🔧 环境变量

🛣 Roadmap

📌 Final Thought

开发

License

Project details

Verified details

Maintainers

Unverified details

Project links

Meta

Classifiers

Release history Release notifications | RSS feed

Download files

Source Distribution

Built Distribution

File details

File metadata

File hashes

File details

File metadata

File hashes