跳转至

正交分解:你的力往哪使

力的方向看清了——还可能在转。回到第一篇留下的问题:

核心问题

你的力,该往哪个方向使?

同向的力

想象两股力作用于同一个物体,方向完全相同。合力很大,对吧?问题是——当其中一股力持续增强时,另一股力的边际贡献在递减。

如果发动机已经提供了 500 马力,你再在车顶加一个小风扇往前吹——理论上合力确实变大了,但那个风扇的存在几乎没有意义。更糟的是,当发动机升级到 1000 马力时,风扇不仅没用,它的重量反而成了累赘。

映射到 agentic systems:如果你在 harness 层做的事情,跟模型能力增长的方向重合——你在补偿模型当前做不好的某个能力维度——那么每一次模型在那个维度上变强,你的工作就被抵消一点。

还记得 Anthropic 那句话吗?

"Assumptions about what Claude can't do need to be re-tested with each step change."

翻译成力学语言:沿着模型能力方向使出的力,保质期取决于模型两次升级之间的间隔。

消耗性投入

这不是说这些工作没有价值——在模型尚未足够强的当下,它们是必要的。但你需要清醒地意识到:这些是消耗性投入,不是累积性投入。它们的价值会随着模型变强而衰减。

正交的力

现在想象两股力方向正交——互成 90 度。

在这种配置下,每股力在自己的方向上独立做功,互不干扰。无论其中一股力变得多强,另一股力的贡献完全不受影响。合力不是简单相加,而是向量和——系统的总自由度增加了。

映射到 agentic systems:存在一些工作,它们的价值不依赖于模型当前有多强或未来会变得多强。无论模型的推理能力翻十倍,无论上下文窗口扩展到无穷,无论架构从 Transformer 变成能量模型或世界模型——这些工作依然有独立价值。

它们正交于模型能力。

判断标准,不是答案

我不打算在这里列出"哪些事情是正交的"。原因很简单:如果我列了,那就成了另一张可能过期的清单。

我给你的是一个判断标准

面对你正在做或准备做的任何一项 harness 工程决策,问自己一个问题——

正交性检验

如果明天模型在这个维度上突然变强了十倍,我今天做的这件事,是变得更有价值,还是变得没有必要?

  • 如果答案是"变得没有必要"——你的力跟模型的力方向重合,你在做消耗性投入。不是说不该做,但要知道它的保质期。
  • 如果答案是"不受影响,甚至更有价值"——你的力正交于模型的力。这是累积性投入。你做的每一份努力,都在为系统增加一个模型自身无法提供的自由度。
  • 如果答案是"我不确定"——这也是有价值的发现。回到上一篇看看模型能力的演进方向,想想你的工作在那个向量上的投影是什么。投影大,小心;投影接近零,放心。

不要跟一股你无法控制的力较劲。找到与它垂直的方向,去做它做不到的事。

延伸阅读

  • Anthropic. (2026). Harnessing Claude's Intelligence. claude.com/blog — 本文引用了其中一句话并将其翻译成力学语言;完整读完它,你会看到 Anthropic 自己是如何理解"模型能力边界"与"harness 工程"之间关系的

概念与实体

本文涉及的核心概念与实体,在项目知识库中有更详细的资料:

  • Harness Engineering — "你的力"的工程化身:正交性检验直接决定 harness 层的投资方向
  • Agentic Systems — 正交分解的作用对象:两股力合成后的完整系统
  • Context Management — 一个典型的正交性待检验项:如果上下文窗口无限扩展,你的管理策略是否仍有独立价值
  • Anthropic — "Assumptions need to be re-tested" 这一关键引文的来源