心 智 七 篇 · Seven Mental Models
← Knowledge Atlas · 概念

System 1 vs System 2(快思考与慢思考)

快思考与慢思考:LLM 当前仅有 System 1,System 2 推理是核心进化方向
概念 · SYSTEM 1 VS SYSTEM 2 · Karpathy 2023 · LLM 快慢思考 · 推理时间分配

系统一与系统二

System 1 vs System 2 — 快思考/慢思考框架与 LLM 推理能力的对应分析

Karpathy(2023)的核心判断:LLM 只有 System 1——每次 token 生成消耗的计算量大致相同(一次前向传播),无论问题简单还是复杂。「铁路上的列车,chunk chunk chunk」。LLM 没有「停下来认真想想」的能力——这是 CoT、Tree-of-Thoughts、o1/o3 系列出现的架构动机。

两个系统的对比
System 1快速 · 直觉 · 自动「2+2=?」→ 答案直接可用当前 LLM:每 token 固定计算量
System 2缓慢 · 理性 · 有意识「17×24=?」→ 分步推导目标:按需分配推理时间
工程化 System 2 的路径
CoT prompting
「展示思考过程」→ 在 token 序列中为推理留出空间
o1/o3 系列
显式分配更多推理时间给困难问题——Karpathy 2023 的预言实现
Kahneman 告诫
S1/S2 不是独立神经基底,是认知捷径。字面工程化为两个系统可能误读框架
Kautz Type 6 映射
神经符号 AI 的终极目标——神经引擎内部能触发符号推理 = S1 集成 S2
→ Meta-Cognition AI · Evaluator-Optimizer · Neurosymbolic AI TaxonomyKahneman (2011) / Karpathy (2023)

System 1 vs System 2(快思考与慢思考)

定义

源自 Daniel Kahneman《Thinking, Fast and Slow》的双系统框架,被 Karpathy2023 年演讲 中引入 LLM 语境:

  • System 1:快速、直觉、自动。“2 + 2 = ?” 不需要计算,答案直接可用
  • System 2:缓慢、理性、有意识。“17 × 24 = ?” 需要分步推导

Karpathy 的核心判断:截至 2023 年,LLM 只有 System 1。每次 token 生成消耗的计算量大致相同(一次前向传播),无论问题简单还是复杂。LLM 没有”停下来认真想想”的能力。

在 LLM 语境中的意义

System 1 的局限

LLM 以固定计算量处理每个 token——如同”铁路上的列车,chunk chunk chunk”。这意味着:

  • 简单问题和困难问题分配相同的推理资源
  • 没有自主的”停下来思考”机制
  • 无法在答案不确定时主动投入更多推理时间

System 2 作为进化方向

Karpathy 描述的理想状态:“you should be able to come to ChatGPT and say here’s my question, actually take 30 minutes, it’s okay, I don’t need the answer right away.”

这预言了后来出现的:

  • Chain-of-thought prompting(让模型”展示思考过程”)
  • Tree-of-thoughts(探索多条推理路径)
  • o1/o3 系列模型(显式分配更多推理时间给困难问题)

自我改进的类比

Karpathy 用 AlphaGo 的两阶段进化来类比 LLM 的发展路径:

  1. 模仿阶段(= 当前 LLM):从人类数据学习,性能天花板 = 最佳人类标注者
  2. 自我博弈阶段(= 未来方向):AlphaGo 用 40 天自我博弈超越人类

但 LLM 面临的根本挑战是:围棋有明确的奖励函数(赢/输),开放域语言没有。在窄域(数学证明、代码验证)可能可行,通用域仍是开放问题。

与 Wiki 已有概念的关系

  • LLM-OS Analogy — System 2 对应 OS 中的”后台复杂计算任务”,System 1 对应”中断响应”
  • Evaluator-Optimizer — 生成-评估循环是一种工程化的 System 2 实现:通过外部循环弥补模型内部缺乏深度推理的不足
  • Harness Engineering — harness 提供的结构化约束可以视为外部化的 System 2——引导模型进行更深思考

Kahneman 的自我批评(来自 arXiv:2501.05435)

2024 年系统综述援引了一个重要的认识论提醒:Kahneman 本人指出,System 1 和 System 2”并不真正存在于大脑中”——它们是对自动处理(automatic)与高唤醒处理(arousal-intensive)的认知科学捷径,而非独立的神经基底。

这一自我否定对 AI 设计有深刻影响:

  • 将”System 1”和”System 2”字面工程化为两个独立子系统,可能误读了原始框架
  • 真正的人类认知是”深度复杂、多层交织、密集互联的统一运作”
  • 向 AGI 演化需要元认知控制系统meta-cognition-ai)——一个能根据任务需求动态分配认知资源的调控层,而非硬性的 S1/S2 二分架构

结论: System 1/2 框架仍然是有用的启发式框架,但应作为设计的方向性指导而非字面蓝图

神经符号 AI 视角(Garcez & Lamb 2020,Kautz 2020)

Kahneman 本人在 AAAI 2020 炉边谈话中澄清了这一框架在 AI 语境中的含义:

  • System 1(隐性/implicit): 直觉并行系统,能够理解语言——Kahneman 认为语言理解属于 System 1,而非 Bengio 主张的深度学习即 System 1
  • System 2(显性/explicit): 顺序的、有意识的符号操作系统

从神经符号 AI 的角度,System 1 对应神经网络的感知/学习能力,System 2 对应符号推理的逻辑/因果能力。Kautz 六类分类法的目标之一,正是在 Type 6(Neuro[Symbolic])层面实现 System 1 和 System 2 的完全集成——让神经引擎内部能够触发符号推理。

与 Karpathy 的”LLM 只有 System 1”诊断高度一致:纯深度学习在 Kautz 分类中最多是 Type 1,神经符号集成才能走向 System 2。这也是 命题固着 问题的另一种表述——一阶逻辑推理(System 2 的核心)超出了纯神经网络的表达边界。

References