Rich Sutton

Rich Sutton：强化学习奠基人，Bitter Lesson 提出者，元方法 vs 领域知识框架

实

实体 · RICH SUTTON · 强化学习奠基人 · The Bitter Lesson · 阿尔伯塔大学

Rich Sutton

加拿大计算机科学家、强化学习奠基人——「苦涩教训」对 agent engineering 的理论支撑

Sutton 的 2019 年短文 The Bitter Lesson 核心论点：AI 研究 70 年的历史证明，通用计算方法（搜索 + 学习）总是最终胜出——人类知识的内建短期有效但长期阻碍进展。这一论断成为 agent harness 工程中「持续剥离假设」和 meta-harness 架构的理论基础。

The Bitter Lesson 的核心论据

国际象棋（Deep Blue）人类知识编码短期领先 → 通用搜索最终胜出

围棋（AlphaGo）专家知识嵌入 → 自对弈学习（Alpha Zero）最终胜出

语音识别HMM 手工特征 → 端到端深度学习最终胜出

NLP语言学规则 → 统计方法 → LLM 通用预训练胜出

对 Agent Engineering 的含义

持续剥离假设

当前有效的 harness 约束未来会被模型能力取代——设计时留出剥离路径

Meta-Harness

不编码具体策略，而是编码让模型自主发现策略的机制——苦涩教训的 harness 实践

理论 vs 工程

Sutton 不做 agent 工程，但他的框架是理解 harness 演化方向的关键视角

→ Harness Engineering · Meta-Harness · AnthropicSutton (2019)

Rich Sutton

加拿大计算机科学家，强化学习领域的奠基人之一，阿尔伯塔大学教授。

与本 wiki 的关联

Sutton 的 2019 年短文 The Bitter Lesson 对 agent engineering 有深远影响：其核心论点（通用计算方法总是胜出，人类知识内建短期有效但长期阻碍进展）成为 harness engineering 中”持续剥离假设”原则和 meta-harness 架构的理论基础。

Sutton 不直接从事 agent 系统工程，但他关于元方法 vs 具体知识的框架是理解 agent harness 进化的关键视角。

References

sources/sutton-bitter-lesson.md