Seven Mental · 心智七篇
← Knowledge Atlas · Concept

Grue 问题(新归纳之谜)

Grue 问题(新归纳之谜):Goodman 1955,同一数据支持矛盾归纳结论,谓词可投射性
CONCEPT · GRUE PROBLEM · NEW RIDDLE OF INDUCTION · GOODMAN 1955

Grue Problem

New Riddle of Induction — from “can we induce” to “how do we induce”

Grue = observed before time t and green, or observed after t and blue. Same emerald observations + same inductive pattern: “green” → predicts green; “grue” → predicts blue. When induction is valid, which predicates earn the right to be projected?

PredicateEvidencePrediction after t
greenAll emeralds pre-t are greengreen ✓
grueAll emeralds pre-t are grueblue ✗

Same data, same reasoning pattern, contradictory conclusions

Projectibility
Goodman's answer
Entrenchment — predicates frequently used in past successful inductions are more projectible
Controversy
This grounds the justification of induction in linguistic convention rather than objective world structure
ML mapping

Overfitting = learning a grue-like predicate — perfect on the training segment, broken after deployment. Time-dependent distribution shift is exactly the grue signature.

→ Problem of Induction · Uniformity Principle · Empiricism · Bayesian InductionGoodman (1955) · SEP

Grue 问题(新归纳之谜)

定义

Grue 问题——也称”新归纳之谜”(new riddle of induction)——是 Nelson Goodman 1955 年提出的对归纳推理的深化质疑。即使承认归纳推理在原则上有效,同一组观察数据可以支持互相矛盾的归纳结论,取决于我们使用哪些谓词来描述观察结果。

Goodman 的论证

定义谓词 “grue”:一个对象是 grue 的,当且仅当它在时间 t 之前被观察到且为绿色,或在时间 t 之后被观察到且为蓝色。

现在考虑在时间 t 之前观察到的所有翡翠都是绿色的:

  • 用”绿色”描述:所有观察到的翡翠是绿色的 → 所有翡翠是绿色的 → 时间 t 后观察到的翡翠将是绿色
  • 用”grue”描述:所有观察到的翡翠是 grue 的 → 所有翡翠是 grue 的 → 时间 t 后观察到的翡翠将是蓝色

两个推理使用完全相同的归纳模式,基于完全相同的观察数据,却得出矛盾的预测。

超越休谟:从”能否归纳”到”如何归纳”

休谟归纳问题问的是:归纳推理是否有理性基础?Goodman 的问题更深一层:即使我们接受归纳有效,我们仍需解释为什么某些谓词(green)是”可投射的”(projectible),而另一些(grue)不是。

休谟描述了我们如何做归纳推理——基于恒常连结和习惯——但他留下了一个空白:为什么我们投射”绿色”而不是”grue”?

“可投射性”的本质

Goodman 自己的回答是”习惯化”(entrenchment):一个谓词是可投射的,当且仅当它在过去的成功归纳中被频繁使用。“绿色”比”grue”更深地嵌入了我们的语言实践。

这个回答引发争议——它似乎将归纳的辩护建立在语言惯例之上,而非客观的世界结构。

与 LLM/Agent 工程的映射

Grue 问题是特征工程和表示学习的哲学基础:

  • 特征选择 = 谓词选择:从原始数据中选择哪些特征来描述数据,等价于选择用哪些谓词描述观察。选错特征,模型学到的”模式”就是 grue 式的虚假关联。
  • 过拟合的哲学本质:过拟合就是学到了 grue 式谓词——在训练时间段内完美解释数据,但在部署后预测失败。
  • 归纳偏置:模型架构本身隐含了哪些谓词是”可投射的”——卷积网络假设空间平移不变性,Transformer 假设注意力机制。
  • 分布偏移中的时间依赖:grue 谓词的核心特征是时间依赖性——某些特征在某个时间点之前有效,之后失效。这正是生产环境中模型退化的典型模式。

与本 wiki 其他概念的关系

  • 归纳问题:Grue 问题是归纳问题的深化——从”是否”到”如何”
  • 齐一性原则:Grue 问题表明 UP 的表述过于模糊——未来与过去在哪个方面相似?
  • 经验主义:Grue 问题挑战了纯经验主义——仅凭观察无法区分 green 和 grue
  • 误差级联:在多步推理中,grue 式错误会被级联放大

References