第 1 课:LLM 记忆系统核心概念与机制概览

⏱ 预计阅读 3 分钟 更新于 2026/5/7
💡 进群学习加 wx: agentupdate
(申请发送: agentupdate)

1.1 为什么 LLM 需要记忆系统

LLM(大语言模型)每次会话都从空白开始,没有“昨天我们讨论过”的概念。这就引出三个工程问题:

  • 重复劳动:你每次都要重新解释项目背景、命令偏好、架构决策。
  • 遗失经验:上次解决过的 bug、调通过的配置、踩过的坑全部消失。
  • 跨项目隔阂:你在项目 A 学到的经验无法迁移到项目 B。

记忆系统的本质是:把“会话外”的知识变成 LLM 在“会话内”能访问的上下文。Claude Code 通过三个互补的机制解决这个问题。

flowchart LR
    A[会话外的知识] --> B{记忆机制}
    B --> C[CLAUDE.md
人写的硬规则] B --> D[auto memory
LLM 写的精选笔记] B --> E[claude-mem
自动捕获的工作日志] C --> F[LLM 上下文] D --> F E --> F

1.2 三大记忆机制概览

特性 CLAUDE.md auto memory claude-mem
来源 Anthropic 官方 Anthropic 官方 第三方(thedotmack)
写入者 用户(手动) LLM(自动判断) hooks(自动捕获)
内容类型 编码规范、架构、命令 偏好、项目决策 工具调用、错误修复、决策
存储格式 纯 Markdown 纯 Markdown SQLite + Chroma(向量库)
加载时机 启动时全文加载 启动加载索引 (200行) 启动注入 + MCP 按需检索
作用范围 项目 / 用户 / 组织 单一 working tree 跨项目全局

简单理解:

  • CLAUDE.md = 项目宪法(你立的规矩)。
  • auto memory = LLM 的笔记本(学习你的偏好和项目特性)。
  • claude-mem = 完整工作日志数据库(保留过去所有任务的痕迹)。