GrowPIP
← 返回所有素材

INFO · info-20260121-127

LeCun JEPA:世界模型的工程化路径

[INFO] LeCun JEPA:世界模型的工程化路径

  • 时间: 2026-01-21
  • 类型: 引用
  • 来源: Yann LeCun "A Path Towards Autonomous Machine Intelligence" (2022) 及后续研究
  • 置信度: 9/10
  • 标签: #AI #JEPA #世界模型 #LeCun #自监督学习

内容

LeCun 对当前 AI 的批评

问题说明
幻觉LLM 优化的是概率似然,不是事实准确性
低效学习需要海量数据,而人类/动物几次就能学会
无法规划只能自回归生成,不能真正推理和规划
缺乏世界模型不理解世界如何运作,只是统计模式匹配

认知架构:六大模块

┌─────────────────────────────────────────────────────────────┐
│                    LeCun 认知架构                            │
│                                                             │
│  ┌─────────────┐                                           │
│  │ Configurator│ ← 配置器:调节其他模块                      │
│  └──────┬──────┘                                           │
│         │                                                   │
│         ▼                                                   │
│  ┌─────────────┐     ┌─────────────┐     ┌─────────────┐  │
│  │ Perception  │────→│ World Model │────→│   Actor     │  │
│  │   感知器    │     │   世界模型   │     │   执行器    │  │
│  └─────────────┘     └──────┬──────┘     └─────────────┘  │
│         ▲                   │                   │          │
│         │                   ▼                   ▼          │
│         │            ┌─────────────┐     ┌─────────────┐  │
│         │            │    Cost     │     │ Short-term  │  │
│         └────────────│   Module    │     │   Memory    │  │
│                      │  代价模块   │     │  短期记忆   │  │
│                      └─────────────┘     └─────────────┘  │
│                             ▲                              │
│                             │                              │
│                      ┌─────────────┐                      │
│                      │ Intrinsic   │                      │
│                      │   Cost      │                      │
│                      │ 内在动机    │                      │
│                      └─────────────┘                      │
└─────────────────────────────────────────────────────────────┘

核心是 World Model(世界模型)

  • 预测行动的后果
  • 支持心理模拟和规划
  • 用 JEPA 架构实现

JEPA:世界模型的实现方式

核心思想:在抽象表示空间预测,而不是在像素空间重建

传统生成模型(如 GPT、扩散模型):
  输入 → 编码 → 解码 → 重建输入的每个细节
                        (预测像素/token)

JEPA:
  输入x → 编码器 → 表示 sx
                      ↓
  输入y → 编码器 → 表示 sy ← 预测器从 sx 预测
                        (在抽象空间预测,忽略无关细节)

为什么这很重要?

生成式(GPT等)JEPA
预测每个细节(像素/token)只预测抽象表示
浪费计算在无关细节上聚焦于语义相关的信息
难以处理不确定性自然处理多种可能结果

两种行为模式

模式说明类比
Mode-1直接反应,不需推理开车时的条件反射
Mode-2使用世界模型进行规划下棋时的深思熟虑

关键:Mode-2 的规划结果可以"编译"进 Mode-1,变成新技能。


JEPA 系列进展

模型时间输入特点
I-JEPA2023.06图像预测图像块的抽象表示,训练效率提升 5x
V-JEPA2024.02视频预测视频中被遮挡部分的表示
V-JEPA 22025视频可用于机器人规划,验证了世界模型理念
VL-JEPA2025.12视觉+语言预测文本嵌入而非 token,参数减少 50%

JEPA vs LLM

维度LLMJEPA
预测目标下一个 token抽象表示
学习方式监督/自回归自监督
处理不确定性差(单一预测)好(表示空间可多模态)
规划能力无(只能续写)有(世界模型支持)
数据效率高(5-6x 提升)

三位批评者的对照

批评者核心主张解决方案状态
HawkinsAI 缺乏世界模型千脑理论、参考框架理论为主,工程过时
PearlAI 缺乏因果模型因果阶梯、SCM数学框架完整,工程待突破
LeCunAI 缺乏世界模型JEPA + 认知架构最工程化,Meta 在推进

LeCun 的独特价值:不只是批评,还给出了可实现的架构和开源代码。

关联

  • 直接相关:

    • INFO-121(千脑智能)- Hawkins 的世界模型方案(理论)
    • INFO-126(Pearl 因果推理)- Pearl 的因果模型方案(数学)
    • INFO-113(AI智能本质)- 三者都在回应"关联性计算的边界"问题
  • 技术对照:

    • JEPA 的"抽象表示空间预测" vs LLM 的"token 自回归预测"
    • JEPA 的"世界模型" vs Pearl 的"因果模型"——是否等价?
  • 待探索:

    • H-JEPA(层次化 JEPA)的多时间尺度预测
    • JEPA 与因果推理的结合可能性
    • JEPA 在 NLP 领域的扩展(目前主要是视觉)

参考资源