Claude 4.8连夜大降智,GPT-5.6算力遭“腰斩”

2026-06-30 13:25:28 · chineseheadlinenews.com · 来源: 新智元

最近,AI社区遭遇集体降智潮!OpenAI疑似暗中开启GPT-5.6灰度测试,神秘“Juice”测试引爆全网查成分;另一边,Anthropic的Claude Opus 4.8被曝断崖式降智,疑似被切脑。我们花钱买到的AI,究竟是什么版本?

两大AI巨头——OpenAI和Anthropic,几乎在同一时间陷入了“降智门”?

过去48小时,AI圈掀起了一场由一段神秘提示词引发的全民自测狂欢。

OpenAI被曝出利用Codex平台悄悄进行GPT-5.6的灰度测试,暗中克扣用户的思考预算。

另一边,则是Opus 4.8遭遇史诗级削弱,曾经惊艳全场的模型,如今连最基础的逻辑推理都频频翻车,甚至开始对用户进行PUA。

Opus 4.8 Max被用户痛斥“被切掉了大脑”,性能从惊艳跌入谷底,甚至不如旧版Haiku模型。

莫非,我们正经历一场巨头们精心设计的实验?

神秘的Juice值,你被灰度到GPT-5.6了吗?

最近,AI社区发现,OpenAI可能正在小范围灰度测试GPT-5.6-sol。

X上一位AI大V发现,在Codex应用中,某些本该运行GPT-5.5 xhigh的会话,被悄悄路由到了名为“gpt-5.6-sol”的未知模型。

要验证自己是否中签,你只需要运行一段“Juice测试”代码即可。

你可以通过Codex App或CLI进行一次快速自查。只需选择 gpt-5.5,将推理设置拉到 xhigh,然后输入上面这段XML代码即可。

这段提示词的本质,是检测模型的隐藏推理算力配额——“Juice”即是模型思考预算的代名词。

实测数据显示,正常的、满血版的 gpt-5.5 xhigh ,在面对特定测试指令时,返回的Juice结果应该是 768。

然而,那些被路由到 gpt-5.6-sol 灰度测试池中的用户,得到的返回值却断崖式下跌到了 128。

-正常GPT-5.5 xhigh: 返回 768

-被灰度到GPT-5.6-sol: 返回 128

768到128,整整缩水了6倍!

这到底是什么意思?

可以说,这要么意味着GPT-5.6的推理效率实现了史诗级飞跃,要么指向了更令人担忧的可能:所谓的新版本,实际上是通过阉割推理深度换来的“低成本缩水版”。

结合最近Anthropic频繁封号的背景,OpenAI此举显得意味深长。他们似乎试图通过这种隐蔽的灰度测试,摸索算力成本与生成质量之间的极限平衡点。

网友们纷纷晒出截图,有人欢呼自己“提前解锁了下个版本”,更多人则忧虑:“如果5.6的思考预算只有5.5的六分之一,这到底是升级还是降级?”

当然,有时模型也会拒绝回答。

这不由让人怀疑,是不是OpenAI在通过路由机制,把一部分用户当小白鼠,测试极度简化版的模型,以节省算力成本?

毕竟,普通人可能感知不到推理深度的细微差异。

Claude的物理切脑:从神坛跌落的Opus 4.8

如果说OpenAI的灰度测试还只是引发好奇与猜测,那么Anthropic对Claude模型的削弱,则是一场明目张胆的“物理切脑”。

现在,Reddit上的 r/Anthropic 版块已经被愤怒的用户抗议所淹没。

很多人发现:所有Claude模型都被严重削弱了,尤其是原本被寄予厚望的Opus 4.8 Max。

在发布初期,Opus 4.8以其深邃的推理能力、极低的幻觉率和“追求真理”的坚定立场惊艳了全场。

然而最近,它似乎遭遇了史诗级降智。

有人说:它被削弱到了荒谬的程度。现在使用Opus 4.8 Max的感觉,通常比使用老款的Haiku模型还要糟糕得多。

它根本不花时间去思考,不做适当的背景研究,甚至一直在对用户进行煤气灯式的精神操控!

在reddit社区中,不断有人吐槽使用降智模型的失望。

拥有1000亿token的高级用户吐槽说,Claude最近一周的行为简直愚蠢至极。

有人说,Opus 4.8仿佛进入了老年痴呆模式。

它忽然失去了长期上下文的记忆能力。用户不得不将所有内容塞进同一个巨大的上下文窗口,一旦开启新会话,模型就会彻底迷失方向。

还有人,自己遇到了杠精附体的Opus 4.8,它会为了唱反调而唱反调。

无论用户输入什么,模型都会扮演反方角色,哪怕是配置服务器集群这种纯粹客观的工作,模型也会强行中断,跳出来说“我得实话实说”,然后用200字的废话去解释一个20字就能说清的概念。

另外,它还会拒绝思考。

在高思考模式下,面对极其低级的错误,模型甚至懒得多运算一秒,直接秒回错误答案。当被指出错误时,还会装傻充愣。

一场精心设计的实验?

有人做出这个令人细思极恐的推测:我们之前看到的那个“神级”Opus 4.8,可能根本就是一个假象。

因为AI市场被未来预期高度驱动,公司必须不断向市场兜售“技术正在飞速进步”的宏大叙事。

为了维持这种叙事,厂商极有可能在产品发布初期,不计成本地给予模型临时的算力增强,制造出重大技术飞跃的幻觉。

一旦热度过去,或者当巨额的推理成本开始反噬财报时,他们就会在黑箱中悄悄拨回参数。

用静默降级老模型的做法,掩盖全盘降智的真相。然而用户的信任,也被透支了。

资本寒冬下的断臂求生——SpaceX抽干的流动性

有人猜测,如此多模型集体降智的直接原因,或许是上市节奏被打乱。

而根本原因,就是未来拿钱的难度呈指数级上升。

原本在今年的美股剧本中,是OpenAI、Anthropic等预留了充足的资金,准备迎接几场史诗级的IPO。

然而就在本月,SpaceX敲钟上市,以1.77万亿美元的史诗级估值,犹如一个巨大的黑洞,瞬间抽干了美股市场上本就不多的流动性。

再加上一些其他原因,留给AI巨头们的池子已经见底了。

本来按照Anthropic的规划,最晚上市时间点是今年的第四季度。

如果上市计划推迟,在公司净利润勉强维持、但研发投入仍在剧烈烧钱的当下,Anthropic能做的,就只有降本增效。

真要说起来,其实让人无法接受的,是信息的不对称。

你每个月花几十美元订阅一个服务,这个服务却可以随时、悄悄地改变产品,而完全不需要告知你。

你发现了问题,却无法确认问题的来源。你提出投诉,却可能被模型PUA。

“Juice测试”之所以引发这么大的共鸣,是因为它象征着一种久违的东西——

让我看看我买到的究竟是什么。


    24小时新闻排行榜更多>>
  1. 中信再辟谣 两个刘俊华?分析:中部战区放飞机进三环
  2. 流亡富豪郭文贵涉诈骗,在美国遭判30年没收8.9亿
  3. 马斯克“百万美元抽奖”涉诈欺 法官命令出庭作证
  4. 北京撞机事件后 国航基地惊现“反习传单”
  5. 73岁习近平吓破胆了 中南海曾“甲级战备”
  6. 王小洪亲信突被调离公安部 分析:拍马不成反惹怒习
  7. 马耳他著名拱门坍塌,1死1伤
  8. 美国三招挺台施压 北京陷战略两难
  9. 网红峡谷5人溺亡,“涨水后几乎没有撤退空间”
  10. 小飞机撞北京高楼 中国“一新兴产业”或遭重创
  11. 读懂“大清洗”共产机制 中共倒塌前夜 疯狂“杀自己人”
  12. 走向历史深处的冯小罢,接不住那份沉重
  13. 字节发全员邮件,强调新领导力原则
  14. 黄晓明当场表白昆凌,让杨颖颜面无存
  15. 夏天电费暴增?1招让冷气省电30%以上
  16. 压哨绝杀!巴西2-1逆转日本进世界杯16强
  17. 鱼油又翻车:并无健脑效果
  18. 热疯了的欧洲人,加钱也抢不到中国空调了
  19. 别偷垃圾桶!纽约抽送5个尼克斯队纪念版
  20. 男子熟睡中被老鼠“啃脸”
  21. 绕开中介,这喜人决定自己卖房
  22. 日元四十年来首次跌破162关口
  23. 2026下半年“由阴转阳” 专家预言:闷烧很久的事要发生了
  24. 别吃这些隔夜菜,夏天尤其危险
  25. 派出所集体去KTV招陪侍,纪委抓现行也只换岗?
  26. 卢卡申科出席儿子北大毕业礼:坚信中国有美好未来
  27. 国庆将至,市境内禁放烟火
  28. 47.5万纽约人恐失白卡 詹乐霞联合24州提告联邦
  29. AI最大的革命,不是替代人,而是取消层级
  30. 大直美击败对手,晋级次轮
  31. 什么是六亲缘浅?很多人都不知道的真相
  32. 中共社会乱象 女孩大街被挟持带离 男孩马路险被抢走
  33. 小飞机事件撞出王小洪 “跨界”露面吉林 藏何玄机
  34. 头发被剪太短,女子起诉理发店获赔
  35. 恶搞习?山东男子当街上演“皇帝的新衣”
  36. 沉默了两年的事,终于还是曝光了
  37. 中国女人走进墨西哥腹地后,发现最可怕的不是毒贩
  38. 谁将从美国哈萨克斯坦矿业中获利?川普儿子们
  39. "一场充满意外的旅行":首批上海游客重返金门,马祖
  40. 遭川普讽刺后,英首相最热人选拒绝美国邀请
  41. 副国级小说家,一生“矛盾”
  42. 美零售商抢先向中国下单,应对关税冲击备战旺季
  43. 困在仅退款里的中小商家:为了88元,威胁“割腕”
  44. 美媒:中共高层喜怒无常 官场惶恐与迷茫气氛加剧
  45. 从明天起,“退休后还要工作”的人有了新规
  46. 愿神韵恩泽天下 救华夏于危难
  47. 郭文贵被判30年监禁后,庭上多次用纸巾擦鼻血
  48. 中共查退休官员被指挖金矿 爆习曾下令砍“圈养肥猪”
  49. “娱乐圈大部分明星失业”冲热搜 网民纷纷比惨
  50. 古人为何认为“色是刮骨刀”?
  51. 习近平更大威胁出现 舆论显示一切刚刚开始
  52. 想转专业的大学生,正排成长队
  53. 七一前华人法拉盛集会 声讨中共暴政与跨国迫害
  54. 1.5万亿美元,存储巨头下场“救市”
  55. 看看郭文贵用骗来的钱买了什么样的豪宅
  56. 女婴弃尸垃圾桶 一张Costco小票 17年后竟成铁证!
  57. 昨天三场足球比赛,一场比一场精彩
  58. 网络热议飞机撞大楼 人们惋惜:格局小了
  59. 郭文贵被指成美中博弈“特殊筹码” 法官:他毫无悔意!
  60. 美最高法院送川普一胜三败!这些案子全碰壁