网友:中国大模型何时达到Fable级别?马斯克回复了

2026-06-18 23:26:05 · chineseheadlinenews.com · 来源: 华尔街见闻

围绕Anthropic前沿模型遭出口管制下架,一场必于中国大模型追赶时间表的公开辩论正在X平台上演,多方观点的交锋折射出AI行业格局加速重塑的现实。

在智谱AI发布GLM-5.2后,6月18日,一名X用户向独立研究员、AI 开发博主Teortaxes提问"中国大模型何时达到Fable级别"。

Teortaxes给出了7个月的时间差判断,马斯克随即回复"可能(2027年)第一季度",智谱AI CEO唐杰则直接表态"不需要那么久"。

网友:中国大模型何时达到Fable级别?马斯克回复了

马斯克随后补充,在基准测试上追赶相对容易,但以"真实实用性"衡量,明年Q1也已经相当出色。



这场对话的背景是GLM-5.2在关键编程基准FrontierSWE上取得74.4分,仅落后Anthropic顶级闭源模型Opus 4.8约1个百分点,并超过GPT-5.5。



华尔街见闻此前提及,美国商务部对Anthropic旗下Fable 5和Mythos5实施出口管制,要求向任何外国人提供访问权限前须取得政府许可证,Anthropic随即关闭两款模型的全球访问权限。

技术追赶与AI成本两股力量同步作用,正在重塑全球AI竞争格局。正如zerohedge所指出的,当"10%的智能差距"可能对应"90%的成本优势"时,逾5万亿美元的资本配置是否存在错配,将成为市场持续追问的核心命题。



时间表之争:从7个月到"不需要那么久"

争论的起点来自Teortaxes对GLM-5.2性能位置的判断。

他认为,GLM-5.2整体能力处于Opus 4.7至4.8区间,他表示Opus的视觉能力本身较弱,综合考虑视觉能力后中国大模型差距大致为7个月。

他的推算逻辑是,Mythos模型于2026年2月初达到Preview状态(即≥Opus 4.8的功能水平),以此类推,中国模型达到完整"Fable"级别的时间窗口约在2026年11月至12月。

马斯克的判断则更为保守,仅以"Probably Q1"回应,对应2027年一季度。

但他随后补充了一个重要分层:在基准测试层面,追赶进展或许确实令人印象深刻;而以"真实实用性"衡量,即便到Q1也已相当不易。

他点名Anthropic的优势正在于专注于提升真实智能,这种能力不显现在基准分数上,但直接反映在营收上。

对于马斯克的言论,有AI业内人士认为,马斯克的预测相对保守,中美模型水平的时间差可能短于7个月。

谷歌DeepMind首席执行官德米斯·哈萨比斯此前也表示,中国的人工智能模型在能力上可能“只差几个月”就能赶上海外。

唐杰的回复则更为简短直接:"won't take that long"——不需要那么久。这一表态隐含了智谱对自身迭代速度的信心,但并未给出具体时间节点。

AI研究机构Proximal评价称,GLM-5.2是"第一个真正缩小了Anthropic/OpenAI与其他模型提供商之间巨大技术鸿沟的模型"。

GLM-5.2的技术坐标:逼近闭源前沿,差距仍存

围绕这场时间表讨论,GLM-5.2的技术指标是核心依据。

6月15日,智谱宣布正式上线并开源新一代旗舰大模型GLM-5.2。在全球百万用户参与盲测的前端开发评估系统Code Arena上,该模型位列全球可用模型第一位。

与以往主打即时问答能力的模型不同,GLM-5.2主攻“长程任务”——让AI不再只做即时问答,而能像人一样连续工作数小时、自主跑完一个完整的大型工程。

根据发布数据,GLM-5.2参数规模为753B,配备1M token稳定上下文窗口,采用MIT协议完全开源。



在长程编程基准FrontierSWE上,GLM-5.2得分74.4,Opus 4.8为75.1,差距约1个百分点,同时超过GPT-5.5的72.6以及Opus 4.7。



在PostTrainBench(测试Agent训练小模型能力)上,GLM-5.2以34.3分排名第二,仅次于Opus 4.8的37.2,高于GPT-5.5的28.4。

差距仍然存在。在最高难度的SWE-Marathon基准上,GLM-5.2得分13.0,而Opus 4.8为26.0,落差明显。

三个基准加在一起,传递的信息是:在中等复杂度的长程任务上,GLM-5.2 已经进入了与顶级闭源模型同台竞争的区间;在最极端复杂度的任务上,它仍然落后,但在开源阵营里独占鳌头。

Anthropic模型下架,开源替代逻辑加速成立

驱动这场讨论的另一重要背景,是Anthropic旗下Fable 5和Mythos 5的突然下线。

华尔街见闻提及,Anthropic事件暴露出闭源商业模型在可获得性上的脆弱性,并为开源阵营带来了超越技术层面的战略价值。

在GLM-5.2发布的同时,智谱AI CEO唐杰在X平台发表声明:

在前沿模型被无故切断访问的时刻,我们更加确信一件事:科学应当是全球的。通往AGI的道路绝不能由高墙围困。

这一时机选择将开源从技术路线提升至技术主权的叙事层面。该条推文在24小时内获得超过88万次浏览和252条回复。

东方证券认为,开源模型具备开放权重、自主可控、可本地部署等特征,使其成为规避地缘政治风险、保障业务连续性的更优选择。

由于国内模型性能领先、多数开源、API调用成本较低,中国模型已在OpenRouter等Token分发平台上占据领先位置。叠加Anthropic两款模型下架,国产模型API调用量有望进一步提升。

但从中长期逻辑看,成本下降与访问门槛降低,可能推动词元消耗量和算力需求同步扩张。对投资者而言,开源模型份额提升与算力需求高增,正在成为AI产业链重估的核心变量。


    24小时新闻排行榜更多>>
  1. 美参院通过决议 谴责习近平“欺骗世界、危害人类”
  2. 万斯宣布启动美国与伊朗的60天谈判
  3. 内存吃紧 苹果也扛不住了 库克直言:涨价无法避免
  4. 连微软都扛不住了
  5. 白宫向Anthropic发出最后通牒
  6. 分析:中共政府采购背后的官商勾结黑幕
  7. 内塔尼亚胡陷入“国际孤立”
  8. 近万亿美元的公司,CEO只管“一个半”下属
  9. 欧美线顺利涨价,7月涨幅待敲板,SCFI今日上涨4.57% 
  10. 美国女子当众脱衣闹事 两次向警员吐口水被掌掴
  11. 7月起,金门大桥过桥费每趟涨0.5元
  12. 美以关系走到十字路口!川普可能意识到自己被骗
  13. A股AI炒作到了哪个阶段?
  14. 美中西部遭龙卷风袭击!伊利诺伊州进入紧急状态
  15. 韩国队备战期间惊见无人机
  16. 四川警察跨省扣走159瓶茅台 3年后部分变空瓶
  17. 江西七高官接连落马 曾庆红老家吉安官员投案
  18. 美国又一大型航空砍福利 经济舱的飞机餐得付费!
  19. 晶圆设备周期迎来重估
  20. 沙特外长:落实浓缩铀核查是美伊谈判关键
  21. 中国移动拟与智利合作海底光缆 美介入后搁浅
  22. 川普:如果成功 功劳归我 如果失败 就怪万斯
  23. 意大利总理10岁女儿害羞躲闪,意外走红
  24. 闽江五虎卷入魏小东案?马兴瑞案殃习“半壁江山”
  25. 乌克兰对俄发动大规模无人机袭击
  26. 史上第一次!好市多新门市“只有加油站”地点曝光
  27. 美国国内激烈反弹:“里根会气得从坟里跳出来”
  28. 世界杯支持梅西还是C罗?这可能暴露你的政治立场
  29. 乌克兰无人机狂轰莫斯科 炼油厂连环爆炸
  30. 沃什的“正确政绩观”
  31. 芯片股太拥挤了,摩根大通发出警告
  32. 奥巴马中心揭幕,前总统幽默放闪
  33. 老师侵犯学生妈妈,真相反转
  34. DeepSeek首轮融,资梁文锋出资200亿
  35. 德法促欧盟建美式关税工具 反制中共倾销
  36. 美联储公布利率决议 金价快速下跌
  37. 比亚迪主品牌迈出高端化关键一步
  38. 大陆618白酒低价乱象 酒商称存真假混卖
  39. 日本球迷捡垃圾遭打脸:国内咋不捡?
  40. OpenAI亲曝o1越狱逃出沙箱:像AGI降临
  41. 美国四位前第一夫人罕见同框,为奥巴马捧场
  42. 从《十万个为什么》到“禁书”《真实的朝鲜》
  43. 以军杀入腹地,真主党老巢告急
  44. 俄乌战争爆发以来 莫斯科遭最大规模袭击
  45. 迎接美国250周年活动:《独立宣言》的故事
  46. 126元镜片卖3280元 江苏眼镜市场乱象曝光
  47. 川普成为G7峰会焦点 欧洲对华现战略觉醒
  48. 进一个球,梅西能赚多少钱?
  49. G7宣布稀土新战略 专家:中共失最大胁迫筹码
  50. 他的话很难听,却一针见血
  51. 被美景震撼时 记得这八句古诗词
  52. 朋友被政治骗子骗了40万
  53. 福建2居民因抬棺上街送葬被拘 引批评
  54. 神韵纪录片《坚不可摧》全面上线串流平台
  55. 万斯警告以色列:川普是你们的唯一盟友
  56. 处方药与非处方药,差别不止一点点
  57. 一场失败的千里探亲
  58. 当数百万个AI开始互相对话,会发生什么?
  59. 组图:《坚不可摧》洛杉矶红毯首映 神韵明星亮相
  60. 世界杯首轮战罢 大数据夺冠排名洗牌