跳转至

舵手

Agentic system 的输出是两股力的合成——模型能力和你在 harness 层做的一切。正交性告诉你力该往哪使。但"使力"的具体机制是什么?你的 harness 到底在做什么类型的工作?

1948 年,一个数学家给这类工作起了名字。

Cybernetics 这个词来自希腊语 κυβερνήτης——舵手。不是哲学家,不是建筑师,是舵手。一个在风浪中实时调整航向的人。

Norbert Wiener 用这个词命名了一个学科:研究系统如何通过反馈来实现控制——无论这个系统是一台蒸汽机、一只猫,还是一个社会组织。

Wiener 的核心洞察(意译)

一个系统的功能,取决于它内部信息流的质量。信息被噪声污染了,系统就失去稳态。反馈回路断了,控制就是一句空话。

— 意译自 Cybernetics: Or Control and Communication in the Animal and the Machine (1948)

写过 agentic system 代码的人,读到这里应该觉得眼熟。

反馈:一个被过度使用、被过少理解的词

日常语言里的"反馈"是别人告诉你做得好不好。控制论里的反馈是一个精确的机制:系统的输出被回送为输入,影响系统的后续行为。

这个机制有两种模式。注意:这里的"正"和"负"不是"好"和"坏"的意思——正反馈往往是危险的,负反馈往往是你想要的。名字反直觉,但逻辑很清楚:

负反馈修正偏差,趋向稳态。恒温器是经典例子——温度高了就关加热器,低了就开,系统围绕设定值振荡。你的 agent 调用工具、拿到结果、据此调整下一步决策——这是负反馈在工作。

正反馈放大偏差,走向失控。麦克风靠近音箱时的啸叫就是正反馈——声音被拾取、放大、再被拾取、再放大,直到系统饱和。你的 agent 产生了一个"幻觉"(hallucination)——模型自信地输出了事实上错误的内容——这个错误信息进入上下文,模型基于错误的上下文产生更多错误。正反馈,只是失控的不是声音,是语义。

Agent 系统里两种反馈同时存在。负反馈让系统趋向目标,正反馈让系统偏离目标——而且偏得越来越快。

你已经在做控制论了

如果你写过 agent 代码,你已经在做控制论——只是可能没人告诉过你。

你在 harness 里写的东西 控制论里叫什么
System prompt、tool definitions 控制信号的初始条件与接口定义
Output parser、evaluator 观察器(Observer)
自动拼接 tool results 并再次调用模型的循环 闭环反馈回路
上下文管理(compaction、summarization) 信号滤波与降噪
权限系统、沙箱隔离 执行器的约束边界
最大步数、超时 正反馈失控的安全阀

这些组件加在一起,就是你的 harness——包裹 LLM 的整个反馈控制系统。这个系统不需要人在每一轮介入;harness 代码自动完成闭环。人的角色在设计时,不在运行时。

为什么要给直觉一个名字

给这些实践一个理论框架,不是为了在简历上多写一行。是为了看清一件事:你凭直觉做出的哪些设计选择有理论依据,哪些只是碰运气——以及碰运气的那些,理论能不能帮你碰得更准。

Harness 是一个整体,但它内部有职责分工。控制论用三个角色来描述这种分工——Observer、Controller、Plant。

延伸阅读

  • Wiener, N. (1948). Cybernetics: Or Control and Communication in the Animal and the Machine. MIT Press. — 控制论的原点;第一部分关于信息、熵、反馈的讨论,至今是理解"为什么系统需要闭环"的最清晰框架

概念与实体

本文涉及的核心概念与实体,在项目知识库中有更详细的资料:

  • Harness Engineering — 本文将 harness 定义为包裹 LLM 的整个反馈控制系统,这里有更完整的工程视角
  • Agentic Systems — 本文讨论的反馈机制是 agentic system 运行的核心结构
  • Context Management — 文中将上下文管理类比为"信号滤波与降噪",这里展开了具体机制
  • Guardrails — 文中提到的权限系统、沙箱隔离等约束边界的详细资料