跳转至

World Models Race 2026

  • 来源: sources/introl-world-models-race-2026.md
  • URL: https://introl.com/blog/world-models-race-agi-2026
  • 作者: Blake Crosley (Introl)
  • 发布: 2026-01-03

摘要

综述 2025-2026 年世界模型领域的爆发:LeCun 离开 Meta 创办 AMI Labs(融资 5 亿欧元),DeepMind 发布 Genie 3(首个实时交互式世界模型),World Labs 推出 Marble(首个商用世界模型产品),NVIDIA Cosmos 下载量超 200 万次。核心论点:世界模型代表了从文本处理向物理模拟、视频生成、具身推理的计算范式转移。

LLM 的天花板论

文章引用 LeCun 的核心主张:LLM 从文本中学习统计模式而非物理现实的理解,因此永远不会达到通用智能。具体局限包括事实幻觉、物理推理失败、因果混淆、时序不一致。

关键参与者

项目 方法 关键能力
AMI Labs (LeCun) I-JEPA 架构扩展 物理理解、持久记忆、行动规划
Genie 3 (DeepMind) 自回归帧生成 24fps 实时 3D 世界、自学物理
Marble (World Labs) 文本/图像→3D 环境 可下载可编辑的持久 3D 世界
Cosmos (NVIDIA) 物理感知视频生成 自动驾驶/机器人合成训练数据
Sora 2 (OpenAI) 视频生成+物理合规 模拟物理约束下的智能体行为

世界模型 vs LLM:互补而非替代

虽然文章倾向"世界模型可能超越 LLM"的叙事,但从 agent 工程角度看,两者更可能互补:LLM 处理语言推理和工具使用,世界模型提供物理环境理解。这对 agentic systems 的多模态演进方向有启示。

References

  • sources/introl-world-models-race-2026.md