心 智 七 篇 · Seven Mental Models
← Knowledge Atlas · 源头

Introducing Claude Opus 4.6

Claude Opus 4.6 发布:1M context、agent teams、adaptive thinking、effort 控制
源头 · CLAUDE OPUS 4.6 · Anthropic News · 2026
CONTEXT WINDOW
1Mtokens
首个 Opus 级百万上下文(beta)
Sonnet 4.5 · 18.5%Opus 4.6 · 76%MRCR v2 · 8-needle · 1M 版本

Claude Opus 4.6

Agentic 编码全面升级 · 长上下文质变 · 过度拒绝率全家最低

Adaptive thinking
模型自判何时深度推理,取代二元开关
Effort 控制
low / medium / high / max 四级
Context compaction
接近阈值时自动摘要替换旧 context(beta)
Agent teams
Claude Code 多 agent 并行协作(研究预览)
128k 输出 token
Terminal-Bench 2.0 · Humanity’s Last Exam · GDPval-AA 达 SOTA
→ long-context · harness-engineering · anthropicanthropic.com/news

Introducing Claude Opus 4.6

摘要

Anthropic 发布 Claude Opus 4.6,在编码、agentic 任务和长上下文处理方面全面升级。首个 Opus 级 100 万 token 上下文窗口。在 Terminal-Bench 2.0、Humanity’s Last Exam、GDPval-AA 等多个基准测试中达到最先进水平。

关键能力提升

  1. Agentic 编码增强:更仔细的规划、更长的任务持续力、更大代码库中更可靠的操作、更好的代码审查/调试(自我纠错)
  2. 长上下文:1M token context window(beta);MRCR v2 8-needle 1M 版本得分 76%(Sonnet 4.5 仅 18.5%),质变级提升
  3. 安全性:与 Opus 4.5 对齐程度持平或更优,所有最近 Claude 模型中过度拒绝率最低

产品与 API 更新

功能说明
Adaptive thinking模型自行判断何时使用深度推理,取代二元开关
Effort 控制low / medium / high (默认) / max 四级
Context compaction (beta)接近阈值时自动摘要替换旧 context
Agent teamsClaude Code 中多 agent 并行协作(研究预览)
128k 输出 token支持更长输出

对 Agent 工程的意义

  • Agent teamsorchestrator-workers 模式的产品化实现
  • Adaptive thinking + effort 控制harness engineering 提供新的智能-延迟-成本调节杠杆
  • Compaction API 使 context management 从 SDK 特性升级为平台级能力
  • 长上下文能力削弱了对激进 compaction 策略的依赖

与其他 source 的关联

References

  • sources/anthropic_official/introducing-claude-opus-4-6.md