实
Rich Sutton
加拿大计算机科学家、强化学习奠基人——「苦涩教训」对 agent engineering 的理论支撑
Sutton 的 2019 年短文 The Bitter Lesson 核心论点:AI 研究 70 年的历史证明,通用计算方法(搜索 + 学习)总是最终胜出——人类知识的内建短期有效但长期阻碍进展。这一论断成为 agent harness 工程中「持续剥离假设」和 meta-harness 架构的理论基础。
The Bitter Lesson 的核心论据
国际象棋(Deep Blue)人类知识编码短期领先 → 通用搜索最终胜出
围棋(AlphaGo)专家知识嵌入 → 自对弈学习(Alpha Zero)最终胜出
语音识别HMM 手工特征 → 端到端深度学习最终胜出
NLP语言学规则 → 统计方法 → LLM 通用预训练胜出
对 Agent Engineering 的含义 持续剥离假设 当前有效的 harness 约束未来会被模型能力取代——设计时留出剥离路径 Meta-Harness 不编码具体策略,而是编码让模型自主发现策略的机制——苦涩教训的 harness 实践 理论 vs 工程 Sutton 不做 agent 工程,但他的框架是理解 harness 演化方向的关键视角
→ Harness Engineering · Meta-Harness · AnthropicSutton (2019)
Rich Sutton
加拿大计算机科学家,强化学习领域的奠基人之一,阿尔伯塔大学教授。
与本 wiki 的关联
Sutton 的 2019 年短文 The Bitter Lesson 对 agent engineering 有深远影响:其核心论点(通用计算方法总是胜出,人类知识内建短期有效但长期阻碍进展)成为 harness engineering 中”持续剥离假设”原则和 meta-harness 架构的理论基础。
Sutton 不直接从事 agent 系统工程,但他关于元方法 vs 具体知识的框架是理解 agent harness 进化的关键视角。
References
sources/sutton-bitter-lesson.md