Agent Resource Control（Agent 资源控制）

Agent 资源控制：AgentCgroup，将 cgroup 概念扩展到 token/API 配额/工具权限等 agent 资源

念

概念 · AGENT RESOURCE CONTROL · AGENT OS 资源层

Agent 资源控制

AgentCgroup — 将 Linux cgroup 扩展到 Agent 特有资源维度

传统 cgroup 限制 CPU / 内存 / IO。Agent 负载的关键资源是 token 消耗、API 调用配额、工具访问权限——突发性、不可预测性、级联性是 agent 资源的三大特征。

资源维度传统 OSAgent OS 新增

CPU / 内存cgroup v2 ✓需按 agent 粒度（非进程）

GPUCUDA MPS/MIG按推理请求公平调度

Token无context window 预算 + 总限额

API 调用无速率限制 + 成本上限

工具访问文件权限动态权限（按任务 / 风险等级）

应用层现状

Context compaction / guardrails / harness retry 间接控制资源

系统层方向

将上述机制下沉到 OS 层，提供更强隔离保证和更低开销

→ Agent OS · Context 管理 · GuardrailsAgentCgroup · ASPLOS 2026

Agent 资源控制是在 OS 层面理解、监控和限制 AI agent 资源消耗的机制。传统的 cgroup 控制 CPU、内存、IO——agent 资源控制需要扩展到 token 消耗、API 调用配额、工具访问频率、GPU 时间片等 agent 特有的资源维度。

AgenticOS Workshop 中的 AgentCgroup 论文（Zheng、Fan、Fu 等）首次系统研究了 AI agent 的 OS 资源消耗模式，并提出将 Linux cgroup 概念扩展到 agent 负载的控制框架。

核心观察：agent 负载的资源消耗模式与传统负载根本不同——

资源	传统 OS 已有	Agent 需要新增
CPU/内存	cgroup v2	按 agent 粒度（非按进程）
GPU	CUDA MPS/MIG	按推理请求的公平调度
Token	无	context window 预算、总 token 消耗限额
API 调用	无	外部 API 速率限制、成本上限
工具访问	文件权限	动态工具权限（按任务、按风险等级）

目前 agent 的资源控制主要在 harness 层实现：

Agent 资源控制的研究方向是将这些机制下沉到 OS 层，提供更强的隔离保证和更低的开销。这不是要替代 harness 层的控制，而是为其提供系统级支撑。

AgenticOS Workshop 的征稿主题中，“语义感知资源管理和调度”是核心议题之一。传统调度器不理解 agent 行为的语义——它看到的是进程和线程，不是”这个 agent 正在关键路径上做决策”或”这个 agent 在低优先级的探索中”。

Fuyun 论文（Li 等）展示了一个具体实例：在 serverless 环境中，用 LLM agent 弥合资源配置的”语义鸿沟”——让 agent 理解函数的语义特征，据此做出更优的资源分配决策。