Seven Mental · 心智七篇
← Knowledge Atlas · Concept

Chaos Engineering for Agents(Agent 混沌工程)

Agent 混沌工程:超时、限流、schema 漂移等故障注入评估
CONCEPT · CHAOS ENGINEERING FOR AGENTS · FAULT INJECTION

Chaos Engineering for Agents

Chaos Engineering — Netflix’s Chaos Monkey methodology applied to agent evaluation

Systematically inject common production faults at the tool-call layer; measure how reliability degrades under unstable infrastructure. Fault injection is the testing dual of guardrails — manufacture failure to verify the defense works.

CategoryFault typeRecoverable
NetworkTransientTimeout / ConnectionResetYes
Rate limitSoftRateLimit / HardRateLimitPartial
DataPartialResponse / SchemaDrift / StaleDataNo
Rate limiting hits hardest
Pass rate under pure rate limits 93.75% vs baseline 96.25%; agents broadly lack exponential-backoff retry
Simpler architectures tolerate more
ReAct recovery 80.9% vs Reflexion 67.3% — “lessons” built on error observations mislead reflection
Fault tolerance decays steeper
|∂R/∂λ| > |∂R/∂ε|; for agents, fault tolerance matters more than robustness
→ Guardrails · Reliability Surface · Error Cascade · HarnessReliabilityBench (2026)

Chaos Engineering for Agents(Agent 混沌工程)

定义

将混沌工程(Chaos Engineering)的故障注入方法论应用于 LLM agent 评估:在工具调用层系统性地注入生产环境常见故障(超时、限流、部分响应、schema 漂移),测量 agent 在基础设施不稳定条件下的可靠性退化。

来源

灵感来自 Netflix 的 Chaos Monkey 和 Site Reliability Engineering 实践。ReliabilityBench 首次将这一方法论系统化应用于 agent 评估。

故障分类

类别故障类型可恢复现实来源
网络TransientTimeoutAPI 延迟尖峰
网络ConnectionReset负载均衡器
限流SoftRateLimit429 响应
限流HardRateLimit账户暂停
数据PartialResponse截断 payload
数据SchemaDriftAPI 版本不匹配
数据StaleData缓存不一致

故障注入机制

故障注入器包裹工具执行层。每次工具调用时,按故障概率 λ 决定是否注入故障:

  • 可恢复故障:返回错误信息,agent 可重试
  • 不可恢复故障:返回被篡改的响应数据,agent 看不出出了问题

强度分级:λ=0.1(5-10% 失败),λ=0.2(15-20%),λ=0.3(25-30%)。

关键实验发现

  1. Rate limiting 杀伤力最大:在消融实验中,纯限流故障的通过率(93.75%)比混合故障基线(96.25%)低 2.5%,说明 agent 普遍缺乏退避重试逻辑
  2. 瞬态超时处理良好:98.75% 通过率,说明基本的重试机制有效
  3. 容错退化比鲁棒性更陡:∂R/∂λ 的绝对值大于 ∂R/∂ε
  4. 简单架构容错更好:ReAct 故障恢复率 80.9%,Reflexion 仅 67.3%——反思机制在错误观察上建立的”教训”反而误导后续行为

与其他概念的关系

  • guardrails 的测试对偶:guardrails 防御故障,混沌工程主动制造故障来验证防御是否有效
  • 结果支持 harness engineering 的核心主张:容错逻辑应放在 harness 层(重试、降级、超时兜底),而非 agent 的推理链
  • 提供 可靠性曲面 λ 维度的测量方法
  • error cascade 呼应:故障注入本质是人为制造级联的起点,观察级联如何展开

References

  • Gupta, A. (2026). ReliabilityBench: Evaluating LLM Agent Reliability Under Production-Like Stress Conditions. arXiv:2601.06112.