Seven Mental · 心智七篇
← Knowledge Atlas · Source

Computer Science as Empirical Inquiry: Symbols and Search

Newell & Simon 1975 图灵奖讲座:物理符号系统假说(PSSH)、启发式搜索假说、问题空间框架、弱方法与强方法、符号 AI 的定性结构律奠基
SOURCE · TURING AWARD 1975 · CACM 1976
🏆Turing Award

Newell · Simon

Computer Science as Empirical Inquiry — Symbols and Search

Computer Science as Empirical Inquiry

Two laws of qualitative structure laying the conceptual foundations of AI and cognitive science

Physical Symbol System Hypothesis (PSSH)
“A physical symbol system has the necessary and sufficient means for general intelligent action.”
symbols → structures → processes · designation + interpretation
Heuristic Search Hypothesis
A physical symbol system exercises its problem-solving intelligence through search — generating and progressively modifying symbol structures
problem space · means-ends analysis · weak methods / strong methods
”Laws of qualitative structure” · paradigms from other sciences
BiologyCell theory
GeologyPlate tectonics
ChemistryAtomic theory
Computer sciencePSSH

“Search — the sequential generation of candidate solutions — is the fundamental aspect of the intelligence a symbol system exercises, but amount of search is not a measure of amount of intelligence.” — the chess paradox: programs generate millions of nodes, human grandmasters consider fewer than 100 branches, yet grandmasters play better.

→ physical-symbol-system · heuristic-search · means-ends-analysis · problem-space · allen-newell · herbert-simonCommunications of the ACM 19(3)

Computer Science as Empirical Inquiry: Symbols and Search

元信息


核心论点

这篇论文做了两件事:

  1. 提出物理符号系统假说(PSSH):一个物理符号系统具备通用智能行为的充分必要条件。
  2. 提出启发式搜索假说:物理符号系统通过搜索来求解问题——在问题空间中生成并递进修改符号结构,直至产生满足条件的解。

两个假说都被定性为”定性结构律”(laws of qualitative structure)——类似于生物学中的细胞学说、地质学中的板块构造——为整个领域奠定最基本的概念地基。


Part I:符号与物理符号系统

定性结构律的范例

科学的核心是定性断言,不是公式。论文以四个科学范例类比:

学科定性结构律
生物学细胞学说:细胞是生命的基本单位
地质学板块构造:地球表面由运动的巨型板块构成
医学细菌学说:大多数疾病由微小单细胞生物引起
化学原子论:元素由均匀的小粒子构成

PSSH 的野心就是成为计算机科学的细胞学说。

物理符号系统的定义

一个物理符号系统包含:

  • 符号(Symbol):能在结构中以物理方式出现的模式
  • 符号结构(Symbol Structure):符号组成的表达式
  • 过程(Processes):创建、修改、复制、销毁符号结构的操作

两个关键概念:

指称(Designation):当系统可以通过表达式访问或影响某个对象时,该表达式指称该对象。

解释(Interpretation):当一个表达式指称某个过程,系统可以执行该过程时,系统就在解释该表达式。

物理符号系统假说(PSSH)

“一个物理符号系统具备通用智能行为的充分必要条件。”

  • 必要性:所有智能系统(包括人类大脑)经分析后将证明是物理符号系统
  • 充分性:足够大、适当组织的物理符号系统将表现出智能行为
  • 通用智能行为:在速度与复杂性限制下,适应环境需求的行为范畴,类似于人类行为的广度

这是一个经验假说——可以被证伪。

符号系统的历史发展

时间里程碑贡献
19世纪末弗雷格、罗素:形式逻辑符号作为无意义标记,语法操作
1930s图灵机机器可计算性、普遍性、不可判定性
1940s存储程序程序即数据,解释原理的物理实现
1956表处理(List Processing)符号可指称其他结构,真正的指称关系
1959–60LISP形式化 S 表达式,与具体机器结构解耦

“表处理产生了指称的模型,从而以我们今天在计算机科学中使用的意义定义了符号操作。“


Part II:启发式搜索

启发式搜索假说

“问题的解被表示为符号结构。物理符号系统通过搜索来行使其求解问题的智能——即通过生成并递进修改符号结构,直至产生满足条件的解结构。“

为什么搜索是必须的

物理符号系统有限的计算资源决定了:它只能串行执行,一次只能做一件事。已知测试条件不等于已知如何直接生成满足条件的解——这就是”问题”之所以存在的原因。

柏拉图的美诺悖论的现代解答:

“陈述一个问题,就是指称 (1) 符号结构类别的测试(解),以及 (2) 符号结构的生成器(候选解)。求解问题,就是用生成器产生满足测试的结构。“

问题空间

在生成器存在之前,必须先建立问题空间——表示问题情境的符号结构空间,包括初始状态和目标状态。移动算子将一个情境转变为另一个情境。

从代数例子看智能搜索

求解 AX + B = CX + D:

  • 非智能方式:随机猜测数字
  • 智能方式:检测当前表达式与目标形式的差异,执行保留解集的变换(两边加减、除以系数)

这演示了:

  1. 每步基于前一步(非独立生成)
  2. 两类信息指导搜索:
    • 常量信息:内置于生成器(变换必须保留解集)
    • 变量信息:逐步检测到的差异(当前形式 vs 目标形式)
    • 用后者实现手段-目的分析(Means-Ends Analysis)

搜索树的悖论

若每个节点产生 B 个分支,深度 D 的树有 B^D 个节点——指数爆炸。

国际象棋的悖论:程序生成数百万节点,人类大师往往不超过 100 个分支,但大师下得更好。

“矛盾的结论是:搜索——连续生成候选解——是符号系统在问题求解中行使智能的根本方面,但搜索量不是智能量的度量。”

暴力搜索的极限

“我们必须将通过蛮力搜索下好象棋的希望视为不那么有前景的——而这个希望在象棋首次被选为 AI 研究对象时曾被寄予厚望。“

弱方法与强方法

弱方法(Weak Methods):当领域知识不足以避免搜索时,依靠通用启发式控制指数爆炸:

  • 最优先搜索(Best-First Search):从最接近目标的节点继续搜索
  • 手段-目的分析(Means-Ends Analysis):检测当前状态与目标的特定差距,选择减少该差距的动作——GPS 的核心
  • Alpha-beta 剪枝:象棋程序的关键技术(约 1958 年)

强方法:利用丰富的领域语义信息,减少或避免搜索(如专家系统)。


不依赖搜索的三种智能途径

1. 非局部信息的使用

树搜索中获得的信息通常只应用于局部。HEARSAY 语音理解系统的”黑板”架构允许多层次并行搜索共享信息,消除了本应需要重复搜索的假设。

2. 语义识别系统

国际象棋大师的强大源于大量存储的棋盘模式知识——估计约 50,000 种模式。罕见模式与问题空间结构紧密相连时包含巨大信息量。这对应于”强方法”。

3. 选择合适的表示

残缺棋盘问题:标准棋盘用 32 个多米诺骨牌完全覆盖。切去对角两格后,31 个骨牌能否覆盖?

  • 暴力方式:穷举所有排列
  • 智能方式:注意到对角格同色,残缺棋盘缺两格同色,而每块骨牌覆盖一黑一白,故无解。

“支配表示的定性结构律仍有待发现。“


结论

计算机科学最基本的定律

物理符号系统是计算机科学最基本的定性结构律。两大已知的符号系统类别:人类计算机

符号系统的理解经历了五个阶段:形式逻辑→图灵机→存储程序→表处理→1956 年综合(AI 研究的起点)。

经验基础

AI 研究积累了大量关于如何组织符号系统以表现智能的具体经验,产生了跨任务领域的归纳——“更接近地质学或进化生物学,而非理论物理学”。

最终问题

“对于所有物理符号系统,被迫串行搜索问题环境的我们,关键问题始终是:接下来做什么?“


关键术语

英文中文简释
Physical Symbol System物理符号系统操纵符号结构的物理实体
Designation指称表达式通过访问或影响对象建立的关系
Interpretation解释系统执行被表达式指称的过程
Problem Space问题空间问题情境的符号表示空间
Means-Ends Analysis手段-目的分析检测差距并选择消弭差距的动作
Weak Methods弱方法知识贫乏时依赖通用启发式的搜索控制
Strong Methods强方法依赖丰富语义知识减少/避免搜索
Heuristic Search启发式搜索有选择地生成候选解的智能搜索策略

与本 wiki 的连接

References

  • Newell, A., & Simon, H. A. (1976). “Computer Science as Empirical Inquiry: Symbols and Search.” Communications of the ACM, 19(3), 113–126.