杨立昆 :只会“文字接龙”的AI没有未来

2026-05-31 16:25:23 · chineseheadlinenews.com · 来源: 土豆包观察局

杨立昆离开 Meta 押注世界模型,正在把 AI 竞争从参数规模战拉回真实世界。

图1:杨立昆肖像与世界模型转向

在全球 AI 行业疯狂堆叠参数、算力和数据的当下,图灵奖得主、深度学习三巨头之一杨立昆(Yann LeCun)给出了一个极具争议的判断:仅靠自回归大语言模型,很难走向真正可靠的高级机器智能。

他的批评并不是否定大模型的工具价值。恰恰相反,LLM 已经证明自己能写作、编程、检索、总结、对话。但在杨立昆看来,它们更像强大的语言接口,而不是能理解现实、预测因果、规划行动的智能体。

换句话说,今天最火的大模型,可能只是 AI 发展史上的过渡形态。真正的下一站,不是更大的文字接龙机器,而是能够在真实世界中学习、预测和行动的世界模型。

▌一、从 CNN 到图灵奖:他为什么有资格质疑大模型

杨立昆出生于法国,是卷积神经网络的重要奠基者之一,并与 Geoffrey Hinton、Yoshua Bengio 共同获得 2018 年 ACM A.M. 图灵奖。

在深度学习从学术边缘走向产业中心的过程中,他既是参与者,也是少数不断提醒行业“别把当前路线神化”的人。

▌二、他为什么敢说:纯 LLM 有天花板

杨立昆对大语言模型的质疑,核心不在“它会不会写得像人”,而在“它是否真的理解世界”。当前主流 LLM 的基本训练目标,是根据上下文预测下一个 token。这个机制非常适合语言生成,却不天然等同于理解、计划和因果推理。

图2:自回归大模型的核心限制示意

因此,很多看似离散的问题其实有同一个根:模型可以输出正确的物理公式,却未必真正理解杯子为什么会摔碎;可以写出漂亮的长文,却可能在复杂推理中前后矛盾;可以模拟专业口吻,却可能在关键事实上一本正经地出错。

▌三、四个硬伤:不是参数不够,而是学习方式不够

第一,是逐 token 生成带来的局部性。模型一步步续写,容易缺少全局目标和稳定规划。长文本、复杂代码、多步骤任务中出现前后矛盾,并不只是“提示词没写好”,也反映出架构本身的限制。

第二,是常识的来源问题。人和动物通过视觉、触觉、行动和反馈获得世界经验,而大模型主要从文字中学习。文字是人类经验的压缩结果,带宽低、抽象高,天然丢失大量真实世界细节。

图3:真实常识来自感知、行动与反馈

第三,是幻觉难以彻底根除。只要目标仍是生成最像样的文本,模型就可能在没有可靠依据时继续补全。对闲聊来说这也许只是尴尬,对医疗、工业、法律等高风险场景来说却可能变成真正的问题。

第四,是离散符号和连续世界之间的错位。现实世界是连续、动态、带有物理约束的系统;token 则是离散符号。用文字统计去逼近现实规律,能覆盖很多表达问题,却很难独自承担真实世界决策。

▌四、世界模型:他押注的不是更大模型,而是另一种智能

杨立昆提出的方向,是让 AI 建立一种内部“世界模型”:它能够感知环境、理解状态、预测后果,并根据目标规划行动。这样的系统不只是回答问题,而是能在某种程度上模拟“如果我这么做,会发生什么”。

图4:世界模型需要形成感知、预测、规划、反馈闭环

这也是他反复强调动物智能的原因。猫狗不会背诵百科,但它们能避开障碍、理解遮挡、预判动作、在物理世界中生存。对杨立昆来说,这些能力才是机器走向更高级智能时必须补上的底层课。

▌五、JEPA:为什么他不迷信生成式路线

为了落地世界模型,杨立昆提出了 JEPA(Joint Embedding Predictive Architecture,联合嵌入预测架构)。它的关键思路不是把缺失内容逐字逐像素生成出来,而是在更高层的抽象表征空间里预测变化。

图5:JEPA 聚焦抽象表征预测,而不是逐像素复刻

这听起来有点抽象,但直觉很简单:人看见一个球滚向桌边,不需要在脑中渲染每一帧像素,也能判断它可能掉下去。JEPA 想学的,正是这种抓住核心变化、忽略无关细节的能力。

▌六、不是 AGI 神话,而是 AMI 路线

杨立昆更愿意谈 AMI,也就是高级机器智能,而不是被资本市场反复包装的 AGI 神话。他的观点是:人类智能并不是无所不能的“通用智能”,而是长期进化出来、适配现实环境的复杂能力集合。

所以,与其幻想一个突然无所不知的超级智能,不如先构建能理解物理世界、掌握常识、进行规划、在真实环境中可靠工作的机器智能。这条路更慢,却也更接近智能本身。

▌七、开源与垄断:他真正担心的风险

在 AI 风险问题上,杨立昆也常常与主流恐慌叙事保持距离。他并不认同“AI 很快自我觉醒毁灭人类”的简单末日论。相比之下,他更警惕少数巨头垄断基础模型和算力资源,进而控制 AI 生态的入口。

这也解释了他长期支持开放研究、开放模型和社区协作的立场。开放并不等于没有风险,但它能让更多研究者参与验证、复现和修正,也能避免最关键的技术只被少数公司握在手里。

图6:AI 的另一场竞争,是开放生态与闭源垄断之争

▌结语:真正的分歧,是 AI 要不要回到真实世界

杨立昆的尖锐之处,不在于他否定大模型,而在于他拒绝把大模型当成智能的终点。LLM 仍然会是重要工具,也会继续改变内容、办公、搜索、编程和交互方式。但如果 AI 要进入机器人、工业控制、医疗辅助、自动驾驶等高风险场景,仅仅会说话远远不够。

真正的智能,必须理解世界。它要知道物体不会因为被遮挡就消失,要知道行动会带来后果,要能在目标、环境和反馈之间不断校正自己。

所以,杨立昆的判断并不是“AI 没有未来”,而是:只靠今天这种文字接龙式 AI,没有未来。下一轮竞争,属于那些能把机器带回真实世界的人。


    24小时新闻排行榜更多>>
  1. ASML冲击万亿美元市值
  2. 风暴眼里的500万跨境炒股散户
  3. 清华硕士做纹眉师,最高月入10万
  4. 以军攻占黎巴嫩中世纪古堡并升旗
  5. OpenAI官宣退役o3与GPT-4.5
  6. 清军能入主中原,日军却做不到?
  7. 软银豪掷750亿欧元法国投资AI
  8. 四面楚歌被全球“群殴” 习近平正吞下自酿的苦果
  9. 鸡蛋含磺胺超标69倍 中国食安事故为何频发?
  10. 在地下2400米寻找答案:永恒有多久?
  11. 睡眠与延缓衰老相关
  12. 问题本身已经不重要了,重要的是:你属于哪一边
  13. 川普亲自出手修改"美伊协议"!嫌不够强硬,要求曝光
  14. 耿同学为何会有这个下场?
  15. 马刺时隔12年重返总决赛!文班22+7隔扣霍姆格伦
  16. 日本熬了30年才走出的深坑,正在悄悄靠近中国
  17. 现在的学术造假已经侮辱了造假行业
  18. 美军"空袭运毒船"炸死3人,累积击毙200毒贩
  19. 浙江三花智控公司5名高管集体减持股份
  20. 中国造船产能是美国200倍
  21. 全球投资者对中国兴趣持续上升
  22. 瑞典将向乌克兰交付36架“鹰狮”
  23. 【百年真相】秋收起义 毛骗了所有人?
  24. 全球300座汽车工厂,快被中国人买光了
  25. 中国古代具有辟邪功用的器物
  26. 戈巴契夫访中与赵紫阳面谈 邓小平动了杀机
  27. 未来人看到2030 中国改国号了
  28. 日本驳斥“新军国主义”指控
  29. 就业难叠加AI冲击 大陆高校外语院系掀撤并潮
  30. 中国第一批“天坑”专业,换马甲回来了
  31. 日本防务大臣否认新军国主义,并批评中国"武器库"
  32. 阿联酋数十次空袭伊朗,遭飞弹报复
  33. 用电高峰提前,AI和空调开始抢电
  34. "车""油""死猪",全球性迷奸网络和对迷药来源的探寻
  35. 许晴身材真丰腴,露肩裙差点“撑变形”
  36. 多城近50℃,印度为什么这么热?
  37. 上海楼市为何先止跌?哪些城市有望跟进?
  38. 德州天然气爆炸 3死5伤 公寓瞬间夷平 居民:如地震
  39. 大陆再发生矿灾 云南盗采矿场崩塌致5死1伤
  40. 海水突然退去的那刻 是不及避难的巨浪正在逼近
  41. 弘一法师离世 为何在身体边留4碗清水?
  42. AI大佬集体朝圣 年轻人为何对AI时代喝倒彩
  43. 大陆明星爆失业潮!去摆地摊、送外卖!
  44. 山东帮骨干王忠林“另有任用” 传卷入马兴瑞大案
  45. 卫星揭中共在沙漠扩建导弹发射建筑 规模让专家震惊
  46. 东升西降成真了吗?报告称中国恐永远无法超越美国
  47. 蓝色起源火箭爆炸 美国登月计划恐受冲击
  48. 中国高铁卡隧道逾2小时 乘客热疯:像从水里捞出来
  49. 青海省黄南州两任副州长相继被“双开”
  50. 黄仁勋谈访华细节:川普坚持让我去 从西岸即赴阿拉斯加登机
  51. 全国入户调查开启,这些事必须注意
  52. 牙没了,用药就能长回来?
  53. 大阪:疑日韩2女扯衣互殴 男伴行为引多国网友吵翻
  54. 云霄飞车卡高空,8人受困4小时
  55. 空调开26℃最省电?
  56. 中国崛起,美国焦虑“失去新药控制权”
  57. 卫星揭秘中共扩建沙漠核基地 专家析背后图谋
  58. 美国“失控”的小费文化是否正在向海外蔓延?
  59. 黄仁勋3年访台11次,外媒揭背后盘算
  60. 美媒:另一个“奥巴马”竞选加州州长