← Knowledge Atlas · 源头
Harnessing Claude's Intelligence: 3 Key Patterns for Building Apps
三大模式:用已知工具、持续剥离假设、谨慎设边界
源
驾驭 Claude 的智能
Three patterns for building apps that keep up with Claude
一
USE what Claude knows
用 Claude 已熟悉的通用工具
bash + text editor 胜过为每个场景定制专用工具。Claude Code 的 SWE-bench 进化证明:同一工具集上能力持续提升。Skills、programmatic tool calling、memory tool 都是 bash + text editor 的组合。
二
ASK “what can I stop doing?”
主动剥离过时假设
让 Claude 编排自身操作(代码执行 ≫ 回流 context)——BrowseComp 45.3% → 61.6%;让 Claude 管理自身 context(skills + context editing);让 Claude 持久化自身 context(compaction + memory folder)。Opus 4.6 compaction 达 84%,Sonnet 4.5 仅 43%。
三
SET boundaries carefully
小心设置边界
Cache 优化(静态优先、不换模型、慎改工具)· 声明式工具(不可逆操作提升为 typed 工具)· 持续重评估(auto-mode 用第二个 Claude 判断 bash 安全性,可减少专用工具)
“应用中的结构或边界应基于『我可以停止做什么?』来修剪——因为它们可能成为 Claude 性能的瓶颈。”
—— Bitter Lesson 的 Agent 版本
→ harness-engineering · agent-skills · context-managementclaude.com/blog
Harnessing Claude’s Intelligence: 3 Key Patterns for Building Apps
- 来源:
sources/anthropic_official/harnessing-claudes-intelligence.md - URL: https://claude.com/blog/harnessing-claudes-intelligence
- 作者: Lance Martin (Anthropic, Claude Platform team)
- 发布: 2026-04-02
摘要
面向应用开发者的实践指南,围绕三大模式构建能跟上 Claude 能力演进的应用。核心论点:agent harness 编码了”模型做不到什么”的假设,这些假设需要持续检验和修剪。
三大模式
1. Use what Claude knows
使用 Claude 已经熟悉的通用工具(bash、text editor),而非为每种场景定制专用工具。Claude Code 的 SWE-bench 进化证明了同一工具集上能力的持续提升。
关键洞察:Agent Skills、programmatic tool calling、memory tool 都是 bash + text editor 的组合产物。
2. Ask “what can I stop doing?”
随模型能力提升,主动剥离 harness 中过时的假设:
- 让 Claude 编排自身操作:给代码执行工具而非将每个工具结果回流 context。编排决策从 harness 转移到模型。在 BrowseComp 上,自主过滤工具输出将 Opus 4.6 准确率从 45.3% 提升到 61.6%。
- 让 Claude 管理自身 context:通过 agent skills 渐进式披露取代预加载所有指令。context editing 选择性移除过时上下文。
- 让 Claude 持久化自身 context:compaction + memory folder。Opus 4.6 在 BrowseComp 上用 compaction 达到 84%(Sonnet 4.5 仅 43%)。
Pokmon 长时对局案例:Sonnet 3.5 写流水账式记忆(31 文件,还在第二个城镇);Opus 4.6 写战术笔记(10 文件、3 个徽章、从失败中蒸馏的教训)。
3. Set boundaries carefully
- Cache 优化:静态优先/动态追加、不换模型、工具增减影响 cache
- 声明式工具:不可逆操作提升为专用工具(typed 参数 → 可拦截、审计、渲染)
- 持续重评估:Claude Code 的 auto-mode 用第二个 Claude 判断 bash 命令安全性,可减少专用工具数量
核心论点:Bitter Lesson 的 Agent 版本
随着时间推移,应用中的结构或边界应基于”我可以停止做什么?“来修剪——因为它们可能成为 Claude 性能的瓶颈。
Sonnet 4.5 需要 context reset 对抗”context anxiety”→ Opus 4.5 中该行为消失 → 之前的 reset 机制成为死代码。
与其他 source 的关联
- 直接延续 Harness Design 的”harness 随模型进化”论点
- “Use what Claude knows” 呼应 Claude Agent SDK 的”给 agent 一台计算机”哲学
- cache 优化细节呼应 Codex agent loop 中的 prompt caching 策略
References
sources/anthropic_official/harnessing-claudes-intelligence.md