I-JEPA: Image Joint Embedding Predictive Architecture

I-JEPA：表征预测架构，世界模型基础，LeCun 愿景

源

源头 · I-JEPA · Meta AI · LeCun 世界模型愿景 · 2023

I-JEPA：预测表征而非像素

”基于 LeCun 愿景的首个 AI 模型”——构建原始世界模型

632M

ViT 参数

16 A100

<72 小时

12/类

ImageNet low-shot SOTA

2-10×

GPU 时间节省

→ world-models · self-supervised · yann-lecunai.meta.com/blog

Meta AI 发布 I-JEPA（Image Joint Embedding Predictive Architecture），被描述为”基于 LeCun 愿景的首个 AI 模型”。核心思想：通过预测图像区域的高层表征（而非像素值）来学习，构建”原始世界模型”。

I-JEPA 是 world models 赛道的理论基础之一——LeCun 的 AMI Labs 正是在此架构上构建其世界模型愿景。预测器充当”原始世界模型”，在语义级别捕获空间不确定性。

研究者计划将 JEPA 方法扩展到视频、图文对等更丰富模态——指向通用世界建模。