← Knowledge Atlas · 概念
Feature Tracking(特性追踪)
特性追踪:结构化 JSON feature list,防止 one-shotting 和 premature victory
念
特性追踪
Feature Tracking — 外部化任务清单,防止两类失败模式
一份外部化的、machine-readable 的任务清单——JSON 格式 feature list,agent 可读取全局进展,可更新完成状态。同时防止”one-shotting”(一次性做完)和”premature victory”(提前宣布完成)两类失败。
JSON 结构
categorydescriptionstepspasses
auth用户登录流程3false
authToken 刷新机制2true ✓
…200+ 条…false
关键约束 只改 passes Agent 只能将 passes 改为 true,不得删除或编辑描述 JSON 非 Markdown 模型不容易”顺手”修改 JSON 结构,比 Markdown 更安全 端到端测试前提 必须经端到端测试验证才能标记通过,禁止自我判断
→ Long-Running Agents · Harness Engineering · Context ManagementAnthropic (2024)
Feature Tracking(特性追踪)
定义
Feature tracking 是 长时运行 agent 中用于追踪任务完成度的结构化机制。其核心是一份外部化的、machine-readable 的任务清单,agent 可以读取以了解全局进展,可以更新以记录自己的成果。
Anthropic 的实践
在 Anthropic 的 harness 设计 中,feature tracking 采用 JSON 格式的 feature list:
- 每条 feature 包含:
category、description、steps、passes(布尔值) - Initializer agent 基于用户需求生成完整列表(200+ 条),所有
passes初始为false - Coding agent 完成并验证一个 feature 后,将其
passes改为true
关键约束
- Agent 只能修改
passes字段,不得删除或编辑测试描述 - 选择 JSON 而非 Markdown,因为模型更不容易”顺手”修改 JSON 结构
- Feature 必须经过端到端测试才能标记为通过
设计意图
Feature tracking 同时解决两个 长时 agent 的失败模式:
- 防止 one-shotting:明确的 feature list 让 agent 知道有多少工作要做,逐个推进
- 防止 premature victory:未通过的 feature 是客观证据,agent 无法”觉得差不多了”就停下
相关概念
- Long-running agents — feature tracking 服务的场景
- Harness engineering — feature tracking 是 harness 的组成部分
- Context management — feature list 是跨 session 状态传递的关键载体
References
sources/anthropic_official/effective-harnesses-long-running-agents.md