← Knowledge Atlas · 源头

World Models Race 2026

世界模型竞赛：AMI Labs、Genie 3、Marble、Cosmos

源

源头 · WORLD MODELS RACE · Introl · 2025-2026 爆发 · 2026-01-03

世界模型竞赛 · 2026

从文本处理 → 物理模拟 / 视频生成 / 具身推理的计算范式转移

LeCun 核心主张——LLM 从文本中学习统计模式而非物理现实的理解，因此永远不会达到 AGI。具体局限：事实幻觉、物理推理失败、因果混淆、时序不一致。

五大参与者 · Leaderboard

AMI Labs

LeCun · 融资 €500M

I-JEPA 架构扩展

物理理解 · 持久记忆 · 行动规划

Genie 3

DeepMind

自回归帧生成

24fps 实时 3D · 自学物理

Marble

World Labs · 首个商用

文本/图像 → 3D 环境

可下载可编辑持久 3D 世界

Cosmos

NVIDIA · 200 万+ 下载

物理感知视频生成

自动驾驶 / 机器人合成训练数据

Sora 2

OpenAI

视频生成 + 物理合规

模拟物理约束下的智能体

与 LLM 互补非替代LLM 处理语言推理 + 工具使用 · 世界模型提供物理环境理解——对 agentic systems 多模态演进的方向有启示

→ world-models · yann-lecun · ami-labs · i-jepa · meta-i-jepaintrol.com/blog

World Models Race 2026

来源: sources/introl-world-models-race-2026.md
URL: https://introl.com/blog/world-models-race-agi-2026
作者: Blake Crosley (Introl)
发布: 2026-01-03

摘要

综述 2025-2026 年世界模型领域的爆发：LeCun 离开 Meta 创办 AMI Labs（融资 5 亿欧元），DeepMind 发布 Genie 3（首个实时交互式世界模型），World Labs 推出 Marble（首个商用世界模型产品），NVIDIA Cosmos 下载量超 200 万次。核心论点：世界模型代表了从文本处理向物理模拟、视频生成、具身推理的计算范式转移。

LLM 的天花板论

文章引用 LeCun 的核心主张：LLM 从文本中学习统计模式而非物理现实的理解，因此永远不会达到通用智能。具体局限包括事实幻觉、物理推理失败、因果混淆、时序不一致。

关键参与者

项目	方法	关键能力
AMI Labs (LeCun)	I-JEPA 架构扩展	物理理解、持久记忆、行动规划
Genie 3 (DeepMind)	自回归帧生成	24fps 实时 3D 世界、自学物理
Marble (World Labs)	文本/图像→3D 环境	可下载可编辑的持久 3D 世界
Cosmos (NVIDIA)	物理感知视频生成	自动驾驶/机器人合成训练数据
Sora 2 (OpenAI)	视频生成+物理合规	模拟物理约束下的智能体行为

世界模型 vs LLM：互补而非替代

虽然文章倾向”世界模型可能超越 LLM”的叙事，但从 agent 工程角度看，两者更可能互补：LLM 处理语言推理和工具使用，世界模型提供物理环境理解。这对 agentic systems 的多模态演进方向有启示。

References

sources/introl-world-models-race-2026.md