Generation-Verification Loop（生成-验证循环）

生成-验证循环：AI 生成、人类验证的协作核心模式，GUI 加速验证、约束生成范围

念

概念 · GENERATION-VERIFICATION LOOP · 人-AI 协作核心

生成-验证循环

Generation-Verification Loop — 人类是瓶颈，优化验证速度

AI 负责生成，人类负责验证。区别于 Evaluator-Optimizer（全自动）——这里验证者是人类，这是根本性区别。优化这个循环的速度决定了人-AI 协作的效率上限。

方向 1：加速验证

GUI > 文本

红绿 diff 一眼看完；Cmd+Y / Cmd+N 比输入文字快 10×

利用视觉 GPU

人类视觉皮层并行处理远超文本阅读；图形化反馈是”高速公路”

方向 2：约束生成（Keep on Leash）

拒绝 10K 行 diff

AI 瞬间生成没有意义——人类仍是验证瓶颈

小增量 + 具体 Prompt

模糊 prompt → 验证失败 → 旋转循环；具体 prompt → 高通过率

中间可审计 Artifact

在 AI 和最终产出之间插入人类可审计的中间产物，防止 AI 迷失

vs Evaluator-Optimizer后者的评估者也是 LLM，是全自动循环；本循环中验证者是人类，AI 生成的 scope 必须配合人类验证能力

→ Evaluator-Optimizer · Autonomy Slider · Harness EngineeringKarpathy (2025)

人与 AI 协作的核心模式：AI 负责生成，人类负责验证。Karpathy 在 Software Is Changing (Again) 中强调，优化这个循环的速度决定了人-AI 协作的效率。

这不同于 evaluator-optimizer 模式——后者的评估器也是 LLM，是全自动循环。Generation-verification loop 中验证者是人类，这是一个根本性区别，因为人类是瓶颈。

GUI > 文本：阅读文本是费力的，看图是”直通大脑的高速公路”。diff 用红绿色显示比读文字描述快得多。Cmd+Y 接受 / Cmd+N 拒绝比输入文本快得多。
可视化表示：利用人类的”视觉 GPU”——视觉皮层的并行处理能力远超文本阅读。

不要 10,000 行 diff：AI 瞬间生成没有意义，人类仍然是验证瓶颈。
小增量：单次生成覆盖小而具体的变更。
具体 prompt：模糊 prompt → 验证失败 → 反复旋转。具体 prompt → 高验证通过率 → 快速前进。
中间 artifact：课程设计案例——教师 app 创建课程（可审计 artifact），学生 app 按课程学习。中间 artifact 阻止 AI “迷失森林”。