[INFO] LeCun JEPA：世界模型的工程化路径

时间: 2026-01-21
类型: 引用
来源: Yann LeCun "A Path Towards Autonomous Machine Intelligence" (2022) 及后续研究
置信度: 9/10
标签: #AI #JEPA #世界模型 #LeCun #自监督学习

内容

LeCun 对当前 AI 的批评

问题	说明
幻觉	LLM 优化的是概率似然，不是事实准确性
低效学习	需要海量数据，而人类/动物几次就能学会
无法规划	只能自回归生成，不能真正推理和规划
缺乏世界模型	不理解世界如何运作，只是统计模式匹配

认知架构：六大模块

┌─────────────────────────────────────────────────────────────┐
│                    LeCun 认知架构                            │
│                                                             │
│  ┌─────────────┐                                           │
│  │ Configurator│ ← 配置器：调节其他模块                      │
│  └──────┬──────┘                                           │
│         │                                                   │
│         ▼                                                   │
│  ┌─────────────┐     ┌─────────────┐     ┌─────────────┐  │
│  │ Perception  │────→│ World Model │────→│   Actor     │  │
│  │   感知器    │     │   世界模型   │     │   执行器    │  │
│  └─────────────┘     └──────┬──────┘     └─────────────┘  │
│         ▲                   │                   │          │
│         │                   ▼                   ▼          │
│         │            ┌─────────────┐     ┌─────────────┐  │
│         │            │    Cost     │     │ Short-term  │  │
│         └────────────│   Module    │     │   Memory    │  │
│                      │  代价模块   │     │  短期记忆   │  │
│                      └─────────────┘     └─────────────┘  │
│                             ▲                              │
│                             │                              │
│                      ┌─────────────┐                      │
│                      │ Intrinsic   │                      │
│                      │   Cost      │                      │
│                      │ 内在动机    │                      │
│                      └─────────────┘                      │
└─────────────────────────────────────────────────────────────┘

核心是 World Model（世界模型）：

预测行动的后果
支持心理模拟和规划
用 JEPA 架构实现

JEPA：世界模型的实现方式

核心思想：在抽象表示空间预测，而不是在像素空间重建

传统生成模型（如 GPT、扩散模型）：
  输入 → 编码 → 解码 → 重建输入的每个细节
                        （预测像素/token）

JEPA：
  输入x → 编码器 → 表示 sx
                      ↓
  输入y → 编码器 → 表示 sy ← 预测器从 sx 预测
                        （在抽象空间预测，忽略无关细节）

为什么这很重要？

生成式（GPT等）	JEPA
预测每个细节（像素/token）	只预测抽象表示
浪费计算在无关细节上	聚焦于语义相关的信息
难以处理不确定性	自然处理多种可能结果

两种行为模式

模式	说明	类比
Mode-1	直接反应，不需推理	开车时的条件反射
Mode-2	使用世界模型进行规划	下棋时的深思熟虑

关键：Mode-2 的规划结果可以"编译"进 Mode-1，变成新技能。

JEPA 系列进展

模型	时间	输入	特点
I-JEPA	2023.06	图像	预测图像块的抽象表示，训练效率提升 5x
V-JEPA	2024.02	视频	预测视频中被遮挡部分的表示
V-JEPA 2	2025	视频	可用于机器人规划，验证了世界模型理念
VL-JEPA	2025.12	视觉+语言	预测文本嵌入而非 token，参数减少 50%

JEPA vs LLM

维度	LLM	JEPA
预测目标	下一个 token	抽象表示
学习方式	监督/自回归	自监督
处理不确定性	差（单一预测）	好（表示空间可多模态）
规划能力	无（只能续写）	有（世界模型支持）
数据效率	低	高（5-6x 提升）

三位批评者的对照

批评者	核心主张	解决方案	状态
Hawkins	AI 缺乏世界模型	千脑理论、参考框架	理论为主，工程过时
Pearl	AI 缺乏因果模型	因果阶梯、SCM	数学框架完整，工程待突破
LeCun	AI 缺乏世界模型	JEPA + 认知架构	最工程化，Meta 在推进

LeCun 的独特价值：不只是批评，还给出了可实现的架构和开源代码。

关联

直接相关:
- INFO-121（千脑智能）- Hawkins 的世界模型方案（理论）
- INFO-126（Pearl 因果推理）- Pearl 的因果模型方案（数学）
- INFO-113（AI智能本质）- 三者都在回应"关联性计算的边界"问题
技术对照:
- JEPA 的"抽象表示空间预测" vs LLM 的"token 自回归预测"
- JEPA 的"世界模型" vs Pearl 的"因果模型"——是否等价？
待探索:
- H-JEPA（层次化 JEPA）的多时间尺度预测
- JEPA 与因果推理的结合可能性
- JEPA 在 NLP 领域的扩展（目前主要是视觉）

[INFO] LeCun JEPA：世界模型的工程化路径

内容

LeCun 对当前 AI 的批评

认知架构：六大模块

JEPA：世界模型的实现方式

两种行为模式

JEPA 系列进展

JEPA vs LLM

三位批评者的对照

关联

参考资源