@trq212 使用 Claude Code：会话管理与 100 万上下文

@trq212 Using Claude Code: Session Management & 1M Context

二〇二六年五月十六日 · 英文原文

摘要

Anthropic 的 Claude Code 拥有 100 万 token 上下文窗口，但需主动管理以避免上下文污染与衰减（约 30-40 万 token 时性能下降）。每次交互后，用户可选择继续、回退（rewind）、清除（/clear）、压缩（/compact）或委托子代理（subagent）。回退优于纠正，压缩有损且可能因方向不明导致 bad compact，子代理拥有独立上下文窗口。建议新任务开启新会话，并主动使用 /compact 附带指令。

最近与Claude Code用户的交流中，一个主题反复出现：100万token的上下文窗口是一把双刃剑。

它让Claude Code能够更长时间地自主运行，更可靠地处理任务，但如果你不刻意管理会话，它也为上下文污染打开了大门。

会话管理比以往任何时候都更重要，而且似乎有很多相关问题。你是在终端里保持一个会话打开，还是两个？每次prompt都从头开始？什么时候应该使用compact、rewind或subagent？什么导致了bad compact？

这里有很多细节，能真正塑造你使用Claude Code的体验，而几乎所有细节都来自你如何管理上下文窗口。

关于上下文、压缩与上下文衰减的快速入门

上下文窗口是模型在生成下一个响应时能一次性"看到"的所有内容。它包括你的系统提示、到目前为止的对话、每次工具调用及其输出，以及所有已读取的文件。Claude Code拥有100万token的上下文窗口。

不幸的是，使用上下文有一点代价，通常被称为上下文衰减（context rot）。上下文衰减是指，随着上下文增长，模型性能会下降，因为注意力分散到更多token上，而较旧、不相关的内容开始干扰当前任务。对于我们的100万上下文模型，我们观察到大约在30-40万token时会出现一定程度的上下文衰减，但这高度依赖于任务——并非硬性规则。

上下文窗口是一个硬性截断，所以当你接近上下文窗口末尾时，需要将你正在处理的任务总结成一个更小的描述，并在新的上下文窗口中继续工作，我们称之为压缩（compaction）。你也可以自己触发压缩。

每一次交互都是一个分支点

假设你刚让Claude做了一件事，它完成了，现在你的上下文中有了一些信息（工具调用、工具输出、你的指令），而接下来你有数量惊人的选项：

继续（Continue）——在同一会话中发送另一条消息
/rewind (esc esc) —— 跳回之前的某条消息，从那里重新尝试
/clear —— 开始一个新会话，通常带有一个你从刚学到的东西中提炼出的brief
压缩（Compact）—— 总结到目前为止的会话，并在总结之上继续
子代理（Subagents）—— 将下一块工作委托给一个拥有自己干净上下文的代理，只将其结果拉回

虽然最自然的方式是直接继续，但其他四个选项的存在是为了帮助你管理上下文。

何时开始新会话

新的100万上下文窗口意味着你现在可以更可靠地完成更长的任务，例如让它从头构建一个全栈应用。但仅仅因为你的模型没有耗尽上下文，并不意味着你不应该开始新会话。

我们的一般经验法则是：当你开始一个新任务时，也应该开始一个新会话。

一个灰色地带是，你可能想做相关的任务，其中部分上下文仍然必要，但并非全部。

例如，为你刚实现的功能编写文档。虽然你可以开始一个新会话，但Claude必须重新读取你刚实现的文件，这会更慢且更昂贵。由于文档可能不是一个对智能要求很高的任务，额外的上下文可能值得换取不必重新读取相关文件的效率提升。

回退而非纠正

如果让我选一个能体现良好上下文管理的习惯，那就是回退（rewind）。

在Claude Code中，双击Esc（或运行/rewind）可以让你跳回之前的任何一条消息，并从那里重新prompt。该点之后的消息会从上下文中丢弃。

回退通常是比纠正更好的方法。例如，Claude读取了五个文件，尝试了一种方法，但没成功。你的本能可能是输入"那没成功，试试X代替。"但更好的做法是回退到文件读取之后，用你学到的东西重新prompt。"不要用方法A，foo模块没有暴露那个——直接去用B。"

你也可以使用"summarize from here"让Claude总结它的学习成果并创建一个交接消息，有点像来自未来版本的Claude（它尝试了某事但没成功）给之前迭代的Claude的消息。

压缩 vs. 全新会话

一旦会话变长，你有两种方式来减轻负担：/compact 或 /clear（然后从头开始）。它们感觉相似，但行为截然不同。

Compact要求模型总结到目前为止的对话，然后用这个总结替换历史记录。它是有损的，你信任Claude来决定什么重要，但你不需要自己写任何东西，而且Claude在包含重要的学习成果或文件方面可能更彻底。你也可以通过传递指令来引导它（/compact focus on the auth refactor, drop the test debugging）。