心 智 七 篇 · Seven Mental Models
← Knowledge Atlas · 实体

MemGPT (Memory-GPT)

MemGPT:UC Berkeley 的虚拟上下文管理系统,LLM as OS 思想的关键实现
实体 · MEMGPT · UC Berkeley · LLM as OS · 虚拟上下文管理 · 2023

MemGPT

将 OS 层次化内存管理思想引入 LLM 上下文管理——“Towards LLMs as Operating Systems”

MemGPT(Packer、Stoica、Gonzalez 等,2023)将操作系统的虚拟内存概念映射到 LLM:main context 类似 RAM,archival/recall memory 类似磁盘。LLM 通过函数调用自主决定何时换页——这是「LLM as OS」架构思路的关键系统实现。

MemGPT vs AIOS:同源异流
维度
MemGPT
AIOS
焦点
单 agent 上下文扩展
多 agent 资源管理
OS 概念
虚拟内存分层
完整内核调度
调度方
LLM 自主换页
Kernel 集中调度
解决问题
Context window 太小
并发 agent 抢资源
核心机制
Main Context (RAM)
活跃工作内存——当前对话、任务状态、近期记忆
Archival Memory (磁盘)
长期持久存储——历史对话、积累知识,按需检索
中断机制
控制流在管理系统与用户之间切换——实现长期会话的自然暂停恢复
工程后继
Anthropic structured note-taking、Codex compaction——层次化思路在生产中的落地
→ Virtual Context Management · Context Management · AIOSarXiv:2310.08560 (2023)

MemGPT (Memory-GPT)

概述

MemGPT 是 UC Berkeley 团队(Charles Packer、Ion Stoica、Joseph Gonzalez 等)于 2023 年提出的系统,将操作系统的层次化内存管理思想应用于 LLM 上下文管理。论文标题”Towards LLMs as Operating Systems”直接表达了其定位:不是一个应用,而是一种系统架构思路。

核心机制

MemGPT 引入 虚拟上下文管理

  1. 层次化存储:main context(类似 RAM)+ archival memory / recall memory(类似磁盘)
  2. 自主调度:LLM 通过函数调用自主决定何时从外部存储读取或写入信息
  3. 中断机制:管理系统与用户之间的控制流切换

评估域

  • 长文档分析:处理远超 context window 的文档
  • 多会话聊天:跨多次对话维持记忆、反思、动态演化

在 Wiki 知识体系中的位置

MemGPT 是”LLM as OS”思想流派的关键系统实现。在本 wiki 的 context management 知识图谱中,它位于”架构级方案”层——介于底层的 compaction 机制和上层的 harness engineering 设计模式之间。

后续的工程实践(Anthropic 的 structured note-taking、initializer-coder 架构;OpenAI 的 Codex compaction)可以视为 MemGPT 层次化思路在生产系统中的具体落地。

与 AIOS 的关系

MemGPT 和 AIOS 都借鉴 OS 概念,但切入点不同:

MemGPTAIOS
焦点单 agent 的上下文扩展多 agent 的资源管理
OS 概念虚拟内存(RAM + 磁盘分层)完整内核(调度 + 内存 + 工具 + 权限)
调度方式LLM 自主决定何时换页Kernel 集中调度
解决的问题Context window 太小并发 agent 抢资源

两者互补:MemGPT 的层次化存储可以作为 AIOS Memory Manager 的底层实现,AIOS 的调度和隔离机制可以管理多个 MemGPT agent 的并发。

相关实体

  • Anthropic — 后续在 context management 工程上的主要推动者
  • OpenAI — Codex 的 compaction 机制与 MemGPT 思路呼应
  • Chroma — context rot 研究为 MemGPT 的分层存储提供了实证支持

References

  • sources/arxiv_papers/2310.08560-memgpt-towards-llms-as-operating-systems.md
  • sources/arxiv_papers/2403.16971-aios-llm-agent-operating-system.md