跳转至

Harnessing Claude's Intelligence: 3 Key Patterns for Building Apps

  • 来源: sources/anthropic_official/harnessing-claudes-intelligence.md
  • URL: https://claude.com/blog/harnessing-claudes-intelligence
  • 作者: Lance Martin (Anthropic, Claude Platform team)
  • 发布: 2026-04-02

摘要

面向应用开发者的实践指南,围绕三大模式构建能跟上 Claude 能力演进的应用。核心论点:agent harness 编码了"模型做不到什么"的假设,这些假设需要持续检验和修剪。

三大模式

1. Use what Claude knows

使用 Claude 已经熟悉的通用工具(bash、text editor),而非为每种场景定制专用工具。Claude Code 的 SWE-bench 进化证明了同一工具集上能力的持续提升。

关键洞察:Agent Skills、programmatic tool calling、memory tool 都是 bash + text editor 的组合产物。

2. Ask "what can I stop doing?"

随模型能力提升,主动剥离 harness 中过时的假设:

  • 让 Claude 编排自身操作:给代码执行工具而非将每个工具结果回流 context。编排决策从 harness 转移到模型。在 BrowseComp 上,自主过滤工具输出将 Opus 4.6 准确率从 45.3% 提升到 61.6%。
  • 让 Claude 管理自身 context:通过 agent skills 渐进式披露取代预加载所有指令。context editing 选择性移除过时上下文。
  • 让 Claude 持久化自身 contextcompaction + memory folder。Opus 4.6 在 BrowseComp 上用 compaction 达到 84%(Sonnet 4.5 仅 43%)。

Pokmon 长时对局案例:Sonnet 3.5 写流水账式记忆(31 文件,还在第二个城镇);Opus 4.6 写战术笔记(10 文件、3 个徽章、从失败中蒸馏的教训)。

3. Set boundaries carefully

  • Cache 优化:静态优先/动态追加、不换模型、工具增减影响 cache
  • 声明式工具:不可逆操作提升为专用工具(typed 参数 → 可拦截、审计、渲染)
  • 持续重评估:Claude Code 的 auto-mode 用第二个 Claude 判断 bash 命令安全性,可减少专用工具数量

核心论点:Bitter Lesson 的 Agent 版本

随着时间推移,应用中的结构或边界应基于"我可以停止做什么?"来修剪——因为它们可能成为 Claude 性能的瓶颈。

Sonnet 4.5 需要 context reset 对抗"context anxiety"→ Opus 4.5 中该行为消失 → 之前的 reset 机制成为死代码。

与其他 source 的关联

References

  • sources/anthropic_official/harnessing-claudes-intelligence.md