Claude 持久记忆配置指南:四层记忆架构,将重复变成积累
对 Claude 的四层持久记忆架构(内置记忆、Project 指令、记忆文件和 Dreaming 后台进程)进行了系统性梳理,提供如何结构化和过滤记忆文件的实践建议。
agent 就像金鱼,每次开始新的对话,它的记忆都是从零开始。
它会重新发现同样的事情、犯同样的错误、问同样的问题,即使这些问题你已经回答过了。
对一个聊天机器人来说这没什么问题,但对一个执行真实重复工作的智能体来说,记忆丢失往往是工作质量无法提高的最大原因。
没有记忆的 Claude,即使将任务重复 100 次,得到的结果在质量上与第 1 次相比,也不会有本质差别。

基础记忆:第 1、2 层
01. 打开 Claude 的内置记忆
2026 年 3 月,Anthropic 向所有 Claude 账号推出了“持久记忆“功能。
Claude 现在会自动跨会话记住你的偏好、正在进行的项目、以及工作方式。
通过个人资料 → Settings → Capabilities → Memory,开启 “Generate memory from chat history” 开关,即可完成设置。
它的底层运行着的是一套记忆合成系统,Claude 大约会每隔 24 小时将你的对话提炼成一份配置文件。
02. 有意播种你的记忆
不要让 Claude 从历史对话中推断你的偏好,毕竟内置记忆大概 24 小时才会更新一次。
但直接在一个对话中要求 Claude 记住某些信息,会立即生效:
记住这些关于我的信息,以后聊天的时候可以参考:
- 我在 [领域] 工作,主要项目是 [项目X、项目Y]
- 我喜欢 [直接写段落 / 不要用项目符号 / 答复简短]
- 我的写作风格是 [描述一下]
- 千万不要 [总是需要纠正的地方]
03. 创建 Project
Project 是一个持久工作区,自定义指令会在该 Project 内的每个会话中持续生效。
Project 尽量按具体工作来命名,在 custom instructions 里写清楚这个 agent 的角色、标准和约束,Project 里的每个会话都会继承这些内容。
04. Project 不会记住的内容
这是大多数人踩坑的地方。
项目会持久保存 instructions,但不会持久保存对话记忆。
你建好一个 Project,给它详细上下文,连续进行了几轮工作。然后你在同一个 Project 里开一个新会话,之前讨论过的内容都会消失。
持久记忆:第 3 层
05. 使用记忆文件
最简单有效的持久记忆方式,是 agent 开始工作前读取,并在工作结束后更新一个独立的记忆文件。
在 Claude Code 里是 CLAUDE.md,其它任何 agent 工具都有类似的对应文件。
官方文档反复强调的文件规则是:保持精简。
一轮新的对话,在输入任何内容之前,可能会花掉大约 20000 个 token 来加载预处理指令,所以不要把这个文件当成百科全书。
如果你使用 Claude Code 的 /init 生成的起始文件,那你应该删掉其中大部分内容。因为它写了很多模型本来就知道的内容。
06. 开启自动记忆
Claude Code 有自动记忆机制,它会记录你的纠正内容和偏好,并在每次会话开始时加载。
在会话中使用 /memory 进行开启 or 关闭,或者在项目里设置 autoMemoryEnabled。
07. 结构化记忆文件
一个没有结构、只会不断增长的记忆文件,很快就会变成一团乱麻。
使用下面方式进行分区:
## 偏好
- 状态更新用项目符号总结,而不是大段文字
- 对任何主张都要引用源文件
## 决策
- 2026-04-18 - 选择 Postgres 而不是 Mongo(用于关系型报告)
## 已知的临时解决方案
- 导出工具处理大于50MB的文件时会卡死;先分割文件
## 需要避免的重复错误
- 不要自动批准修改认证模块的 PR
08. 决定什么值得记住
不是所有东西都应该被保存。
每次重要会话结束后,agent 会回顾发生的事情,只提取值得保留的内容:决策、变通方案、偏好、失败模式等。其它一切不重要的内容都应该被忘记。
一个好的筛选方法是:这会改变 agent 的下一次行动吗?如果会,就存下来。如果不会,就放弃这些内容。
什么都存,和什么都不存,一样无效。
自我提升记忆:第 4 层
09. 理解 Dreaming 到底是什么
2026 年 5 月 6 日,在 Code with Claude 活动上,Anthropic 发布了有关「Dreaming」的研究。
这个名字有意借用了神经科学里的概念:人类睡觉时,大脑会把一天的经历巩固成长期记忆。
而 Dreaming 对智能体来说,也是同样的效果。
它是一个定时后台进程,它会读取 agent 现有的记忆和过去的会话文字记录,然后生成一个新的、重新组织过的记忆仓库。在这个过程中,Claude 会合并重复内容、替换过时内容、洞察新的发现。
在你正式使用之前,值得注意的是,Dreaming 只对那些反复执行相同任务的 agent 有帮助。
由于整合过程需跨多个会话进行,因此仅凭一次性的会话,其内容量不足以构成有意义的整合。
避免这些破坏记忆的行为
- 把 Projects 当成 memory:项目保留的是指令,而不是对话历史。
- 把所有内容都丢进
CLAUDE.md:臃肿的记忆文件会浪费 token,并淹没关键信息。精简的结构胜过极致完整。 - 存储记忆时未经过滤:如果所有东西都需要记住,那就等于没有东西值得记住。只保存那些未来会改变行为的部分。
- 在低频 agent 上运行 Dreaming。Dreaming 是在许多会话之间的整合模式。一个月只跑两次的 agent,积累不出足够内容。
最后
大多数人在使用 Claude 时,每次都开启一个全新的、毫无记忆的会话,每一次运行都要重新解释一遍需求,然后奇怪为什么自己的 agent 效果始终不理想。
而搭好这四层,你将得到一个了解你、能持续积累所学、甚至可以重写自己记忆的 agent。
它会越来越敏锐,越来越好用。