← Knowledge Atlas · 源头
Introducing Claude Opus 4.6
Claude Opus 4.6 发布:1M context、agent teams、adaptive thinking、effort 控制
源
CONTEXT WINDOW
1Mtokens
首个 Opus 级百万上下文(beta)
Sonnet 4.5 · 18.5%→Opus 4.6 · 76%MRCR v2 · 8-needle · 1M 版本
Claude Opus 4.6
Agentic 编码全面升级 · 长上下文质变 · 过度拒绝率全家最低
Adaptive thinking
模型自判何时深度推理,取代二元开关
Effort 控制
low / medium / high / max 四级
Context compaction
接近阈值时自动摘要替换旧 context(beta)
Agent teams
Claude Code 多 agent 并行协作(研究预览)
128k 输出 token
Terminal-Bench 2.0 · Humanity’s Last Exam · GDPval-AA 达 SOTA
→ long-context · harness-engineering · anthropicanthropic.com/news
Introducing Claude Opus 4.6
- 来源:
sources/anthropic_official/introducing-claude-opus-4-6.md - URL: https://www.anthropic.com/news/claude-opus-4-6
- 作者: Anthropic
- 发布: 2026
摘要
Anthropic 发布 Claude Opus 4.6,在编码、agentic 任务和长上下文处理方面全面升级。首个 Opus 级 100 万 token 上下文窗口。在 Terminal-Bench 2.0、Humanity’s Last Exam、GDPval-AA 等多个基准测试中达到最先进水平。
关键能力提升
- Agentic 编码增强:更仔细的规划、更长的任务持续力、更大代码库中更可靠的操作、更好的代码审查/调试(自我纠错)
- 长上下文:1M token context window(beta);MRCR v2 8-needle 1M 版本得分 76%(Sonnet 4.5 仅 18.5%),质变级提升
- 安全性:与 Opus 4.5 对齐程度持平或更优,所有最近 Claude 模型中过度拒绝率最低
产品与 API 更新
| 功能 | 说明 |
|---|---|
| Adaptive thinking | 模型自行判断何时使用深度推理,取代二元开关 |
| Effort 控制 | low / medium / high (默认) / max 四级 |
| Context compaction (beta) | 接近阈值时自动摘要替换旧 context |
| Agent teams | Claude Code 中多 agent 并行协作(研究预览) |
| 128k 输出 token | 支持更长输出 |
对 Agent 工程的意义
- Agent teams 是 orchestrator-workers 模式的产品化实现
- Adaptive thinking + effort 控制 为 harness engineering 提供新的智能-延迟-成本调节杠杆
- Compaction API 使 context management 从 SDK 特性升级为平台级能力
- 长上下文能力削弱了对激进 compaction 策略的依赖
与其他 source 的关联
- Harnessing Claude’s Intelligence 基于 Opus 4.6 能力给出应用开发指导
- Harness Design 中的”harness 随模型进化”论点在 Opus 4.6 得到验证
References
sources/anthropic_official/introducing-claude-opus-4-6.md