心 智 七 篇 · Seven Mental Models
← Knowledge Atlas · 源头

MemGPT: Towards LLMs as Operating Systems

MemGPT:虚拟上下文管理,OS 层次化内存映射到 LLM context,长文档分析与多会话聊天
源头 · MEMGPT · UC Berkeley · arXiv 2310.08560 · 2023-10-12

MemGPT · LLM 作为操作系统

虚拟上下文管理——借鉴 OS 层次化内存突破 context window 约束

不只是比喻——MemGPT 把虚拟内存管理的具体机制(分页、中断、层次化存储)映射到 LLM 上下文管理。中断 + 函数调用 = page fault 机制,实现 context 内外的自动数据迁移。

RAMfast · limitedcontext window~128k tokensmain context · working setDISKslow · unboundedexternal storagearchival · recall memorypersistent · addressablepage faultevict映射机制 · MAPPING• LLM context window= RAM• archival / recall memory= disk• 函数调用= page fault• 中断机制= 控制流调度
长文档分析处理远超单个 context window 的文档
多会话聊天跨长期交互记忆、反思、动态演化的对话 agent
→ virtual-context-management · llm-os-analogy · context-management · long-running-agentsarXiv 2310.08560

MemGPT: Towards LLMs as Operating Systems

元信息

  • 来源: sources/arxiv_papers/2310.08560-memgpt-towards-llms-as-operating-systems.md
  • 远程: https://arxiv.org/abs/2310.08560
  • 作者: Charles Packer, Sarah Wooders, Kevin Lin, Vivian Fang, Shishir G. Patil, Ion Stoica, Joseph E. Gonzalez
  • 发表: 2023-10-12
  • 备注: 本次 ingest 仅基于 arXiv 摘要,未获取全文。提取深度有限。

摘要

MemGPT 提出虚拟上下文管理virtual context management)——一种借鉴操作系统层次化内存体系的技术,用于突破 LLM 有限 context window 的约束。

核心类比:

  • LLM context window = RAM(快速但有限)
  • 外部存储(archival memory, recall memory)= 磁盘(慢速但大容量)
  • 函数调用 = page fault(触发数据在快慢存储间移动)
  • 中断机制 = 控制流管理(系统与用户之间的调度)

关键贡献

  1. OS-LLM 类比的系统化:不只是比喻,而是将虚拟内存管理的具体机制(分页、中断、层次化存储)映射到 LLM 上下文管理
  2. 两个评估域
    • 长文档分析:处理远超单个 context window 的文档
    • 多会话聊天:创建能跨长期交互记忆、反思、动态演化的对话 agent

与 Wiki 已有知识的关联

与 Context Management 的关系

MemGPT 是 context management 领域的早期系统性方案。Wiki 中已记录的 compaction、context reset、structured note-taking 等策略,可以视为 MemGPT 层次化内存思路在工程实践中的具体演化:

  • Compaction 对应 MemGPT 中 main context 的压缩(RAM 内的数据整理)
  • 外部化状态(progress file、git history)对应 archival memory(磁盘持久化)
  • Sub-agent 架构 对应独立地址空间的进程隔离

与 Context Rot 的关系

Context rot 从实证角度证明了 MemGPT 要解决的问题确实存在——不仅是 context window 放不下,而且放太多进去本身就损害性能。MemGPT 的层次化方案天然地将活跃信息与不常用信息分离,是对抗 context rot 的架构级策略。

与长时运行 Agent 的关系

长时运行 agent 面临的跨 session 失忆问题,正是 MemGPT 多会话聊天评估域要解决的场景。Anthropic 后来提出的 initializer-coder 架构和 structured note-taking,与 MemGPT 的 recall memory 在功能上对齐。

OS 类比的更广视角

MemGPT 是 “LLM as OS” 这一思想流派的重要节点。这条线从 Karpathy 的 LLM OS 概念、到 MemGPT 的虚拟内存实现、到 AIOS 的完整 OS 内核映射、再到 ASPLOS 2026 的 AgenticOS workshop,构成了一条从类比到工程的演进路径。

References

  • sources/arxiv_papers/2310.08560-memgpt-towards-llms-as-operating-systems.md