心 智 七 篇 · Seven Mental Models
← Knowledge Atlas · 实体

Rich Sutton

Rich Sutton:强化学习奠基人,Bitter Lesson 提出者,元方法 vs 领域知识框架
实体 · RICH SUTTON · 强化学习奠基人 · The Bitter Lesson · 阿尔伯塔大学

Rich Sutton

加拿大计算机科学家、强化学习奠基人——「苦涩教训」对 agent engineering 的理论支撑

Sutton 的 2019 年短文 The Bitter Lesson 核心论点:AI 研究 70 年的历史证明,通用计算方法(搜索 + 学习)总是最终胜出——人类知识的内建短期有效但长期阻碍进展。这一论断成为 agent harness 工程中「持续剥离假设」和 meta-harness 架构的理论基础。

The Bitter Lesson 的核心论据
国际象棋(Deep Blue)人类知识编码短期领先 → 通用搜索最终胜出
围棋(AlphaGo)专家知识嵌入 → 自对弈学习(Alpha Zero)最终胜出
语音识别HMM 手工特征 → 端到端深度学习最终胜出
NLP语言学规则 → 统计方法 → LLM 通用预训练胜出
对 Agent Engineering 的含义
持续剥离假设
当前有效的 harness 约束未来会被模型能力取代——设计时留出剥离路径
Meta-Harness
不编码具体策略,而是编码让模型自主发现策略的机制——苦涩教训的 harness 实践
理论 vs 工程
Sutton 不做 agent 工程,但他的框架是理解 harness 演化方向的关键视角
→ Harness Engineering · Meta-Harness · AnthropicSutton (2019)

Rich Sutton

加拿大计算机科学家,强化学习领域的奠基人之一,阿尔伯塔大学教授。

与本 wiki 的关联

Sutton 的 2019 年短文 The Bitter Lesson 对 agent engineering 有深远影响:其核心论点(通用计算方法总是胜出,人类知识内建短期有效但长期阻碍进展)成为 harness engineering 中”持续剥离假设”原则和 meta-harness 架构的理论基础。

Sutton 不直接从事 agent 系统工程,但他关于元方法 vs 具体知识的框架是理解 agent harness 进化的关键视角。

References

  • sources/sutton-bitter-lesson.md