MIT研究,穷人福音:不用堆显卡,抄顶级模型

2026-01-10 01:25:14 · chineseheadlinenews.com · 来源: 新智元

高分模型未必懂科学,有的只是在“死记硬背”!MIT揭秘:模型越聪明,对物质的理解就越趋同。既然真理路径已清晰,我们何必再深陷昂贵的算力竞赛?

现在的AI for Science,就像一场“多国峰会”,大家用不同的语言描述同一件事。

有人让AI读SMILES字符串,有人给AI看原子的3D坐标,大在不同的赛道上比谁预测得准。

但有一个问题:这些AI是在“找规律”,还是真的理解了背后的物理真相?

在MIT的一项研究中,研究员把59个“出身”不同的模型凑在一起,观察它们在理解物质时,隐藏层表达是否相同 。

结果非常惊人:虽然这些模型看数据的方式天差地别,但只要它们变得足够强大,它们对物质的理解就会变得极度相似 。

更神奇的是,一个读文字的代码模型,竟然能和一个算受力的物理模型在“认知”上高度对齐 。

它们沿着不同的路,爬到了同一座山峰的顶端,开始共同描绘物理与现实的“终极地图”。

真理的汇合:为什么顶尖模型越长越像?

为了验证这些模型是否真的在靠近真理,研究者引入了一个关键指标:表征对齐度。

简单来说,就是看两个模型在处理同一个分子时,它们脑子里的思路有多相似。

结果发现,性能越强的模型,思维方式就越接近。

在实验中,随着模型预测物质能量准确度的提升,这些模型在表达空间里会自发地向同一个方向靠拢。

性能与认知的同步:能量预测越精准,模型与顶尖基座的思维方式就越趋同。每个点代表一个模型;点大小对应模型大小。

尽管这些AI的架构千差万别,但它们在处理同一批分子数据时,其特征空间的复杂度竟然压缩到了一个非常窄的范围。

无论模型外壳多么复杂,它们最后抓取的都是最核心、最精简的物理信息 。

化繁为简:虽然AI架构各异,但它们提取的物质特征在数学复杂度上却“殊途同归”。

这一特征在Orb V3这样的模型上更加明显。

跨架构的表征对齐:矩阵中的深色区域显示了Orb V3等高性能模型与其它严谨物理模型(如MACE、EqV2)之间强烈的共鸣。

通过更自由的训练,它们可以更精准地对齐物理规律。

这也说明,当喂给AI的数据足够多、训练方式足够对路,它甚至能越过人类现有的公式,自己摸索出物质运行的本质规律。

这种收敛现象表明,AI并没有胡思乱想,它们正在合力挖掘物质世界那个唯一、真实、且客观的底层逻辑 。

不止分子,连“猫”都一样!

你以为这种“英雄所见略同”只发生在科学AI里?大错特错!

有研究者把纯文本的语言模型(比如GPT系列)和纯图像的视觉模型(比如CLIP或DALL·E背后的模型)拉出来比对,结果发现,它们对“猫”的理解,竟然越来越像!

在语言模型里,“猫”的向量表示会紧紧靠近“毛茸茸”“喵喵叫”“宠物”“抓老鼠”这些词。

在视觉模型里,“猫”的向量则靠近胡须、圆眼睛、软毛、优雅的尾巴等视觉特征。

本来两个模型一个只看文字、一个只看图片,压根没交集。

但模型规模越大、性能越强,这两个完全不同模态的“猫”表示,就在线性空间里越靠越近,仿佛在共享同一个“猫的本质”!

这意味着AI不管从文字、图像、分子结构还是3D坐标切入,只要足够强大,就会在内部悄悄趋向同一个对现实的“内在图景”。

高分不是真理,警惕“迷路”的AI

高性能模型都在山顶汇合,那剩下的模型都在干什么?

研究者发现,性能不佳的模型有两种“死法”:一种是各想各的,在错误的道路上渐行渐远;另一种则是集体变笨,虽然想的一样,但都漏掉了关键信息。

有些模型虽然跑分不错,但思维方式却非常孤僻。

比如MACE-OFF,它在处理某些分子任务时表现很强,但它的表征对齐度却极低,完全不能融入主流高性能模型。

它可能只是在特定领域里找到了某种规律,一旦跨出这个舒适区,它的经验就很难转移到其他科学任务上。

图中白色的点代表模型从未见过的分子结构。可以看到,模型在处理这些结构时误差(MAE)激增,且表征完全偏离了正常的物理分布。

而当AI遇到训练数据里从未出现过的物质时,它们往往会放弃思考,一起摆烂,或者集体走进算法设计者留下的“舒适区”,丢掉了物质最核心的化学特征。

由此可见,训练数据不仅仅是模型的养料,更是决定模型能否触碰真理的基础。

如果数据不够多样,哪怕模型的架构再精妙,也终究只是在原地踏步,无法进化成真正的通用基座模型。

真理唯一,我们离算力自由还有多远

既然实验已经证明,不同的AI都在向同一种物理理解靠拢,那我们还有必要堆昂贵的显卡,从头训练一个超级大模型吗?

很显然,没有。而且AI已经替我们找到了一条捷径——“模型蒸馏”。

研究发现,规模较小的模型,通过模仿那些高性能基座模型的“思维方式”,也能表现出惊人的潜力。

我们不再需要盲目追求参数量的堆砌,而是利用“真理收敛”的特性,把大模型的知识复刻到更轻量、更高效的小模型身上。

图中圆点的大小代表模型参数量。可以看到,即使是较小的模型,只要其表征能与最佳性能模型对齐,同样能在分子能量预测任务中获得极高的准确度。

这对未来模型的开发具有深远的意义。

Orb V3向我们展示了“苦涩的教训”的另一种解法:通过大规模训练和聪明的正则化手段,简单的架构同样能学到那些昂贵的、强加物理限制的模型才有的理解力 。

多元架构的对比(部分):论文评估了包括Orb、MACE、DeepSeek在内的近60种模型,为科学家的选择提供了定量依据。

在未来,评估一个科学AI的标准将变得更加多元。我们不仅看它当下的“考分”,更要看它是否踏入了“真理的收敛圈”。

一旦我们掌握了这种对齐的逻辑,科学发现将不仅是巨头们的算力竞赛,更多轻量级、针对特定场景的AI将如雨后春笋般涌现,真正实现“算力自由”下的创新爆发。

MIT的研究给狂热的AI竞赛浇了一盆冷水,但也指了一条明路。

科学AI的进阶之路,不再是更复杂的架构,也不是更漂亮的物理公式,而是看谁能更稳地进入那个“收敛圈”。

我们不需要沉默算力竞赛,因为真理的路径已经清晰——所有聪明的模型都在往一处跑,那么通过“表征对齐”来实现模型的轻量化和知识迁移,就成了最务实的工程方案。

未来的科学,将属于那些懂得利用收敛性来降低成本的人。


    24小时新闻排行榜更多>>
  1. 传北京官场私下流行嘲弄中共党魁
  2. 事关中国,美商务部撤销计划
  3. “兔子警官”李语蔚当选2025最美浙警
  4. 有人天生免疫力好 6个特征 快看看你是吗?
  5. 买个榴莲人间蒸发 绝密聊天记录“直接带走 别让她回家”
  6. 伊朗大规模抗议进入第13天 川普政权或濒临崩溃
  7. “小鹿大战犀牛”影片,百万人看呆
  8. 一场跨国追捕,揭开最赤裸的中美博弈序幕
  9. 川普霸气揭秘 “俄舰像老鼠一样逃窜!”
  10. 委内瑞拉辟谣
  11. 高市早苗考虑提前大选
  12. 全美抗议不断 被ICE击毙女子临死前最后一句话是......
  13. 清华教授的脑机接口,让瘫痪的人动起来了
  14. 分析:委内瑞拉变天或引骨牌效应 中共心惊
  15. 加州被指存在巨额医疗欺诈 规模比明州大
  16. 伊朗动荡严重加剧,流亡的“前王储”试图复辟
  17. “歼10CE首获实战战果”入选柄防科技工业十大新闻
  18. 美FCC批准SpaceX再部署7500颗星链卫星
  19. 川普将访华 美商务部撤回对中国无人机限制新规
  20. 美国12月非农就业报告“提前泄露” 市场降息预期骤变
  21. 惊天爆料 美军已掌握“一小时全球抓人”黑科技 活捉马杜罗只是小试牛刀
  22. 美国ICE特工射杀女子细节曝光 她曾对执法人员说....
  23. 从唐飞机坠机到C919 专家析中国航空安全
  24. MIT研究,穷人福音:不用堆显卡,抄顶级模型
  25. 伊朗女性燃烧最高领袖照片来点烟 挑战权威规范
  26. “中国刻蚀机之父”放弃美国籍 为办税务拟套现近1亿
  27. 日本知名巨头退出中国内地市场,平价品牌狂奔
  28. 川普:中国在台湾问题上的行动“取决于”习近平
  29. 川普政府冻结5民主党州百亿美元补助 法官裁定暂停
  30. 纽约连发涉警枪击案,市长反应引质疑
  31. 越来越多华人选择回国养老,真相令人深思
  32. 中方在永兴岛开设首家商业中心 越南官方反应强烈
  33. 旧金山飞北京航班降落前突然复飞 备降至大兴机场
  34. 故宫养心殿对观众重新开放 内部照片上新啦!
  35. 巴黎启动极寒预案:街头露宿仍难解决
  36. “领导30万员工1万”,员工称直播谈话时被总经理袭击
  37. 石油、政变与绑架:马杜罗的“权力游戏”终局
  38. 一场惊天动地的斩首行动,是如何组织起来的?
  39. 台湾新党干部闹场骂日议员 被指破坏民主规则
  40. 马斯克旗下AI陷性暴露内容风波
  41. 1989年,美国出兵强抓巴拿马领导人
  42. 2025年个人income统计图
  43. 质疑奖金分配不公 大陆一期货公司员工遭停职
  44. AI照片骗过5位评委,获摄影比赛第一名?
  45. 囤积商品的时代来临了
  46. 凯利小绿人遭遇事件 枪械对其毫无作用
  47. 吴恩达:图灵测试不行,我来设计一个
  48. NASA宇航员突发疾病撤离
  49. 小柄圭亚那在川普拉美战略转变中举足轻重
  50. 港媒曝“法理谋独”未遂的内幕:民进党出现裂痕
  51. 《我不是药神》原型陆勇重返印度,计划停药
  52. 川普:需要拥有格陵兰岛,以防与中俄做邻居
  53. 格陵兰岛各政党领导人发表声明:不想成美国人
  54. 北约担忧川普将以“艰难”方式得到格陵兰岛
  55. 伊朗示威升温,巴勒维之子吁占领城市中心
  56. 南非与俄罗斯、伊朗和中国举行联合海军演习
  57. 买个榴莲人间蒸发 中共“官商警黑”一体化的器官掠夺战
  58. 民主神话的终结与强人时代的回归
  59. 【时政春秋】高院推迟关税判决 川普逻辑回头看
  60. 美没收陈志12.7万枚比特币被指黑吃黑 合法性存疑