心 智 七 篇 · Seven Mental Models
← Knowledge Atlas · 概念

Generation-Verification Loop(生成-验证循环)

生成-验证循环:AI 生成、人类验证的协作核心模式,GUI 加速验证、约束生成范围
概念 · GENERATION-VERIFICATION LOOP · 人-AI 协作核心

生成-验证循环

Generation-Verification Loop — 人类是瓶颈,优化验证速度

AI 负责生成,人类负责验证。区别于 Evaluator-Optimizer(全自动)——这里验证者是人类,这是根本性区别。优化这个循环的速度决定了人-AI 协作的效率上限。

方向 1:加速验证
GUI > 文本
红绿 diff 一眼看完;Cmd+Y / Cmd+N 比输入文字快 10×
利用视觉 GPU
人类视觉皮层并行处理远超文本阅读;图形化反馈是”高速公路”
方向 2:约束生成(Keep on Leash)
拒绝 10K 行 diff
AI 瞬间生成没有意义——人类仍是验证瓶颈
小增量 + 具体 Prompt
模糊 prompt → 验证失败 → 旋转循环;具体 prompt → 高通过率
中间可审计 Artifact
在 AI 和最终产出之间插入人类可审计的中间产物,防止 AI 迷失
vs Evaluator-Optimizer后者的评估者也是 LLM,是全自动循环;本循环中验证者是人类,AI 生成的 scope 必须配合人类验证能力
→ Evaluator-Optimizer · Autonomy Slider · Harness EngineeringKarpathy (2025)

Generation-Verification Loop(生成-验证循环)

定义

人与 AI 协作的核心模式:AI 负责生成,人类负责验证。Karpathy 在 Software Is Changing (Again) 中强调,优化这个循环的速度决定了人-AI 协作的效率。

这不同于 evaluator-optimizer 模式——后者的评估器也是 LLM,是全自动循环。Generation-verification loop 中验证者是人类,这是一个根本性区别,因为人类是瓶颈。

两种优化方向

1. 加速验证

  • GUI > 文本:阅读文本是费力的,看图是”直通大脑的高速公路”。diff 用红绿色显示比读文字描述快得多。Cmd+Y 接受 / Cmd+N 拒绝比输入文本快得多。
  • 可视化表示:利用人类的”视觉 GPU”——视觉皮层的并行处理能力远超文本阅读。

2. 约束生成(keep AI on leash)

  • 不要 10,000 行 diff:AI 瞬间生成没有意义,人类仍然是验证瓶颈。
  • 小增量:单次生成覆盖小而具体的变更。
  • 具体 prompt:模糊 prompt → 验证失败 → 反复旋转。具体 prompt → 高验证通过率 → 快速前进。
  • 中间 artifact:课程设计案例——教师 app 创建课程(可审计 artifact),学生 app 按课程学习。中间 artifact 阻止 AI “迷失森林”。

与 wiki 其他概念的关系

  • Evaluator-Optimizer — 全自动版本的生成-评估循环,验证者是 LLM 而非人类
  • Autonomy Slider — 滑块越高,单次循环中 AI 生成的 scope 越大,验证难度越高
  • Harness Engineering — “keep AI on leash”的工程实现:约束、工具、反馈回路
  • Feature Tracking — feature list 是约束 AI 生成范围的具体机制
  • Context Engineering — 具体 prompt 是 context engineering 在循环层面的应用

References

  • sources/karpathy-software-is-changing-again.md — Karpathy 2025 YC 演讲