← Knowledge Atlas · 源头

Harnessing Claude's Intelligence: 3 Key Patterns for Building Apps

三大模式：用已知工具、持续剥离假设、谨慎设边界

源

源头 · HARNESS PATTERNS · Anthropic Platform · 2026-04-02

驾驭 Claude 的智能

Three patterns for building apps that keep up with Claude

一

USE what Claude knows

用 Claude 已熟悉的通用工具

bash + text editor 胜过为每个场景定制专用工具。Claude Code 的 SWE-bench 进化证明：同一工具集上能力持续提升。Skills、programmatic tool calling、memory tool 都是 bash + text editor 的组合。

二

ASK “what can I stop doing?”

主动剥离过时假设

让 Claude 编排自身操作（代码执行 ≫ 回流 context）——BrowseComp 45.3% → 61.6%；让 Claude 管理自身 context（skills + context editing）；让 Claude 持久化自身 context（compaction + memory folder）。Opus 4.6 compaction 达 84%，Sonnet 4.5 仅 43%。

三

SET boundaries carefully

小心设置边界

Cache 优化（静态优先、不换模型、慎改工具）· 声明式工具（不可逆操作提升为 typed 工具）· 持续重评估（auto-mode 用第二个 Claude 判断 bash 安全性，可减少专用工具）

“应用中的结构或边界应基于『我可以停止做什么？』来修剪——因为它们可能成为 Claude 性能的瓶颈。”

—— Bitter Lesson 的 Agent 版本

→ harness-engineering · agent-skills · context-managementclaude.com/blog

Harnessing Claude’s Intelligence: 3 Key Patterns for Building Apps

来源: sources/anthropic_official/harnessing-claudes-intelligence.md
URL: https://claude.com/blog/harnessing-claudes-intelligence
作者: Lance Martin (Anthropic, Claude Platform team)
发布: 2026-04-02

摘要

面向应用开发者的实践指南，围绕三大模式构建能跟上 Claude 能力演进的应用。核心论点：agent harness 编码了”模型做不到什么”的假设，这些假设需要持续检验和修剪。

三大模式

1. Use what Claude knows

使用 Claude 已经熟悉的通用工具（bash、text editor），而非为每种场景定制专用工具。Claude Code 的 SWE-bench 进化证明了同一工具集上能力的持续提升。

关键洞察：Agent Skills、programmatic tool calling、memory tool 都是 bash + text editor 的组合产物。

2. Ask “what can I stop doing?”

随模型能力提升，主动剥离 harness 中过时的假设：

让 Claude 编排自身操作：给代码执行工具而非将每个工具结果回流 context。编排决策从 harness 转移到模型。在 BrowseComp 上，自主过滤工具输出将 Opus 4.6 准确率从 45.3% 提升到 61.6%。
让 Claude 管理自身 context：通过 agent skills 渐进式披露取代预加载所有指令。context editing 选择性移除过时上下文。
让 Claude 持久化自身 context：compaction + memory folder。Opus 4.6 在 BrowseComp 上用 compaction 达到 84%（Sonnet 4.5 仅 43%）。

Pokmon 长时对局案例：Sonnet 3.5 写流水账式记忆（31 文件，还在第二个城镇）；Opus 4.6 写战术笔记（10 文件、3 个徽章、从失败中蒸馏的教训）。

3. Set boundaries carefully

Cache 优化：静态优先/动态追加、不换模型、工具增减影响 cache
声明式工具：不可逆操作提升为专用工具（typed 参数 → 可拦截、审计、渲染）
持续重评估：Claude Code 的 auto-mode 用第二个 Claude 判断 bash 命令安全性，可减少专用工具数量

核心论点：Bitter Lesson 的 Agent 版本

随着时间推移，应用中的结构或边界应基于”我可以停止做什么？“来修剪——因为它们可能成为 Claude 性能的瓶颈。

Sonnet 4.5 需要 context reset 对抗”context anxiety”→ Opus 4.5 中该行为消失 → 之前的 reset 机制成为死代码。

与其他 source 的关联

直接延续 Harness Design 的”harness 随模型进化”论点
“Use what Claude knows” 呼应 Claude Agent SDK 的”给 agent 一台计算机”哲学
cache 优化细节呼应 Codex agent loop 中的 prompt caching 策略

References

sources/anthropic_official/harnessing-claudes-intelligence.md