← Knowledge Atlas · 概念

Context Rot（上下文腐烂）

Context Rot：LLM 性能随输入长度增长的系统性退化，注意力稀释、干扰项干涉、结构干扰三种机制

念

概念 · CONTEXT ROT · CHROMA 命名 2025

Context Rot

Context Rot — LLM 性能随 token 数增长的系统性退化

模型不会均匀处理其 context window——第 10,000 个 token 不如第 100 个可靠。这不是任务变难了，而是相同内容在更长 context 中准确率系统性下降。

注意力稀释

随输入长度增加，每个 token 分配到的注意力被稀释；needle 语义相似度越低，退化越快

干扰项干涉

相关但错误的内容干扰检索；Claude 倾向弃权，GPT 倾向幻觉——家族级差异

结构干扰

逻辑连贯的 haystack 反而比打乱顺序更损害性能——注意力被结构”吸引”

vs Lost-in-MiddleLITM 是特定位置效应（中间弱）；Context Rot 是全局退化趋势（越长越弱），两者都需要 context engineering 来对抗

工程含义不是”能放就放”——Just-in-time 加载、主动 compaction 不只是节约，更是质量保证

→ Context Engineering · Context Management · CompactionChroma (2025)

Context Rot（上下文腐烂）

定义

Context rot 是指 LLM 性能随输入 token 数增长而系统性退化的现象。由 Chroma 在 2025 年的研究中命名和系统化测量。

核心含义：模型不会均匀地处理其 context window——第 10,000 个 token 不如第 100 个 token 可靠。

机制

Chroma 的研究通过控制实验隔离出三种退化机制：

1. 注意力稀释（Attention Dilution）

随着输入长度增加，模型对每个 token 分配的注意力被稀释。表现为：

Needle-question 语义相似度越低，退化越快
并非任务变难了——同样的 needle-question 配对在短 context 中表现良好

2. 干扰项干涉（Distractor Interference）

与 needle 主题相关但不正确的内容（distractor）会干扰模型检索正确信息。关键发现：

不同 distractor 的干扰强度不均匀
这种非均匀性随输入长度增长而放大
模型家族对 distractor 的反应策略不同：Claude 倾向弃权，GPT 倾向幻觉

3. 结构干扰（Structural Interference）

逻辑连贯的 haystack 反而比打乱顺序的 haystack 更损害性能——暗示注意力机制被结构化内容”吸引”，从而减少对 needle 的关注。

与 Lost-in-the-Middle 的区别

Lost-in-the-middle 是一个已知的位置效应（中间位置的信息更难检索）。Context rot 是一个更广泛的概念——它不限于位置效应，而是包含了所有随输入长度增长的退化现象。Chroma 的 NIAH 实验在 11 个 needle 位置上未发现显著位置效应，暗示 context rot 的机制比单纯的位置偏差更复杂。

对 Agent 系统的影响

Context rot 对 harness engineering 和 context management 有直接的工程含义：

Compaction 不仅是节约 token：即使 context window 足够大，过长的 context 也会主动损害性能。Compaction 的价值从”防止溢出”变为”维持性能”。
RAG vs 长 context：context rot 为 RAG（检索增强生成）提供了实证支持——与其把所有信息塞入 context，不如只检索相关部分。这也是 Chroma 作为向量数据库公司的研究动机。
Distractor 管理：guardrails 和检索系统需要不仅过滤无关内容，还需过滤相关但不正确的干扰内容。
任务复杂度放大：Chroma 的实验使用极简任务；实际 agent 任务涉及多步推理，预期退化更严重。长时运行 agent 尤其脆弱。

度量方法

Chroma 的实验设计提供了一个可复用的 context rot 度量框架：

保持任务难度不变，仅变化输入长度
控制 needle-question 相似度、distractor 数量、haystack 结构
使用 LLM 判断器（GPT-4.1，与人类判断 >99% 对齐）评估输出

与 Context Compression 的双重约束

Context rot 和 context compression 共同定义了 context 管理的两难：不压缩则 context 过长导致性能退化（context rot），过度压缩则丢失关键信息需要重新获取。Factory 的压缩评估表明即使最好的压缩方法也只达到 3.70/5.0 的信息保留质量，这意味着实践中需要在两种损失之间寻找平衡点。

References

sources/chroma-context-rot.md

Context Rot

Context Rot（上下文腐烂）

定义

机制

1. 注意力稀释（Attention Dilution）

2. 干扰项干涉（Distractor Interference）

3. 结构干扰（Structural Interference）

与 Lost-in-the-Middle 的区别

对 Agent 系统的影响

度量方法

与 Context Compression 的双重约束

相关概念

References