源
世界模型竞赛 · 2026
从文本处理 → 物理模拟 / 视频生成 / 具身推理的计算范式转移
LeCun 核心主张——LLM 从文本中学习统计模式而非物理现实的理解,因此永远不会达到 AGI。具体局限:事实幻觉、物理推理失败、因果混淆、时序不一致。
五大参与者 · Leaderboard
01
AMI Labs
LeCun · 融资 €500M
I-JEPA 架构扩展
物理理解 · 持久记忆 · 行动规划
02
Genie 3
DeepMind
自回归帧生成
24fps 实时 3D · 自学物理
03
Marble
World Labs · 首个商用
文本/图像 → 3D 环境
可下载可编辑持久 3D 世界
04
Cosmos
NVIDIA · 200 万+ 下载
物理感知视频生成
自动驾驶 / 机器人合成训练数据
05
Sora 2
OpenAI
视频生成 + 物理合规
模拟物理约束下的智能体
与 LLM 互补非替代LLM 处理语言推理 + 工具使用 · 世界模型提供物理环境理解——对 agentic systems 多模态演进的方向有启示
→ world-models · yann-lecun · ami-labs · i-jepa · meta-i-jepaintrol.com/blog
World Models Race 2026
- 来源:
sources/introl-world-models-race-2026.md - URL: https://introl.com/blog/world-models-race-agi-2026
- 作者: Blake Crosley (Introl)
- 发布: 2026-01-03
摘要
综述 2025-2026 年世界模型领域的爆发:LeCun 离开 Meta 创办 AMI Labs(融资 5 亿欧元),DeepMind 发布 Genie 3(首个实时交互式世界模型),World Labs 推出 Marble(首个商用世界模型产品),NVIDIA Cosmos 下载量超 200 万次。核心论点:世界模型代表了从文本处理向物理模拟、视频生成、具身推理的计算范式转移。
LLM 的天花板论
文章引用 LeCun 的核心主张:LLM 从文本中学习统计模式而非物理现实的理解,因此永远不会达到通用智能。具体局限包括事实幻觉、物理推理失败、因果混淆、时序不一致。
关键参与者
| 项目 | 方法 | 关键能力 |
|---|---|---|
| AMI Labs (LeCun) | I-JEPA 架构扩展 | 物理理解、持久记忆、行动规划 |
| Genie 3 (DeepMind) | 自回归帧生成 | 24fps 实时 3D 世界、自学物理 |
| Marble (World Labs) | 文本/图像→3D 环境 | 可下载可编辑的持久 3D 世界 |
| Cosmos (NVIDIA) | 物理感知视频生成 | 自动驾驶/机器人合成训练数据 |
| Sora 2 (OpenAI) | 视频生成+物理合规 | 模拟物理约束下的智能体行为 |
世界模型 vs LLM:互补而非替代
虽然文章倾向”世界模型可能超越 LLM”的叙事,但从 agent 工程角度看,两者更可能互补:LLM 处理语言推理和工具使用,世界模型提供物理环境理解。这对 agentic systems 的多模态演进方向有启示。
References
sources/introl-world-models-race-2026.md