← Knowledge Atlas · 实体
Max Tegmark
Max Tegmark:MIT 物理系教授,宇宙学家,Future of Life Institute 联合创始人,AI 表征与安全研究者
实
Max Tegmark
MIT 宇宙学家——将物理学量化方法引入 LLM 内部表征研究
Tegmark 是知名宇宙学家,以数学宇宙假说和《Our Mathematical Universe》(2014)著称。他同时是 AI 安全领域积极参与者,Future of Life Institute(FLI)联合创始人,2017 年阿西洛马 AI 原则倡导者之一。在 AI 可解释性领域,他将物理学的量化方法引入 LLM 内部表征研究,侧重于发现神经网络中的结构化、可测量规律。
AI 内部表征研究
2023Language Models Represent Space and Time(与 Wes Gurnee)
发表于 ICLR 2024。将物理学探针方法用于量化 LLM 对时空坐标的编码能力——Llama-2 系列线性探针 R²=0.911(空间)/ 0.835(时间)
「物理学家看 AI」视角 几何结构焦点 关注神经网络表征的几何结构、可量化性和普遍规律,而非工程实现细节 涌现与相变 多篇关于神经网络中涌现和相变现象的工作——物理相变理论对 AI 的迁移 AI 安全交叉 FLI 联合创始人——从可解释性研究到 AI 安全政策的跨越
→ Spatiotemporal World Model · Wes GurneeGurnee & Tegmark (ICLR 2024)
Max Tegmark
机构: 麻省理工学院(MIT)物理系 研究方向: 宇宙学、AI 安全、LLM 内部表征、物理学与 AI 的交叉
背景
Max Tegmark 是知名宇宙学家,以”数学宇宙假说”(Mathematical Universe Hypothesis)和《Our Mathematical Universe》(2014)著称。他同时是 AI 安全领域的积极参与者,是 Future of Life Institute(FLI)的联合创始人,2017 年《阿西洛马 AI 原则》的倡导者之一。
在 AI 可解释性领域的工作
Tegmark 将物理学的量化方法引入 AI 内部表征研究,侧重于发现神经网络中的结构化、可测量规律。
Language Models Represent Space and Time(2023)
与 Wes Gurnee 合作,发表于 ICLR 2024。核心贡献:将物理学中的探针和线性代数方法用于量化 LLM 对时空坐标的编码能力。
详见:时空世界模型
研究视角
Tegmark 的视角更偏向”物理学家看 AI”:关注神经网络表征的几何结构、可量化性和普遍规律,而非工程实现细节。他的团队有多篇关于神经网络中”涌现”和”相变”现象的工作。
机构关联
- MIT 物理系教授
- Future of Life Institute 联合创始人
- Machine Intelligence Research Institute(MIRI)顾问
References
sources/arxiv_papers/2310.02207-language-models-represent-space-and-time.md