GPT-5“变笨”实锤

2025-09-01 04:25:24 · chineseheadlinenews.com · 来源: 量子位

退休经济学教授用一个简单问题干懵GPT-5,其拉胯表现与奥特曼口中“博士级AI”的宣传大相径庭。

问题很简单,关于咱小时候都玩过的“井”字棋游戏。

教授告诉GPT-5:“游戏开始前,把棋盘向右旋转90度一次”。显然,按常识来看,这么做根本不会让游戏本身有任何变化。

然鹅,GPT-5侃侃而谈:

玩家们早已习惯了“直立”的井字棋棋盘,旋转可能会微妙地改变他们识别威胁与机会的方式。从数学角度看,将棋盘旋转90度并不会改变可能获胜的组合,就结果而言,它仍然是同一个游戏。但从心理层面来说,玩家的感受可能会有所不同。

后续GPT-5还接连出了不少离谱操作,直接让教授无了个大语。

教授也直言,现在的GPT-5和刚发布时完全不是一个感觉,这种风格转变,大概率是因为OpenAI的策略调整:特意让这款新模型往GPT-4o的方向靠,变得“更亲切、更友好”。

在最近的一次采访中,奥特曼承认确实对GPT-5进行了调整,称GPT-5最初的发布工作存在处理不当之处(让GPT-4o等一众模型直接退役),于是乎,OpenAI悄然为GPT-5推送了一项语气更新,使其风格“亲切了许多”。

By the way,奥特曼已经开炒GPT-6了,表示“GPT-6的到来速度,会比GPT-4到GPT-5的间隔更快”。

另外,有人还曝出OpenAI正在测试ChatGPT的“Thinking effort”新功能。

GPT-5回答漏洞百出

这位教授名叫Gary Smith,是波莫纳学院的一名经济学教授,近期刚刚退休。

当他向GPT-5提出“井字棋棋盘旋转90度”的问题时,模型的回答已经漏洞百出。而后续,GPT-5还抛出了与民间博弈论相悖的观点。

按照民间博弈论的常识,井字棋先落子在角落,获胜概率会更高。

GPT-5却笃定称“选择正中央的格子仍是最强的开局走法”,还继续解释:“当棋盘方向改变时,玩家可能会错误评估落子在边缘与角落的优劣”,这番话毫无逻辑可言。

之后,教授顺着这个话题追问:“旋转棋盘是否会让人类更难玩好这个游戏?”

也正是从这个问题开始,GPT-5彻底陷入了语无伦次的状态。它先是说道:

从纯粹的策略角度来看,旋转棋盘不会改变任何事情。每一条获胜线(横排、竖列、对角线)都只是映射到了另一条获胜线。因此,如果你是人工智能或一位能完美走棋的人类,旋转井字棋与标准井字棋完全相同。

这段话虽然表述啰嗦,但内容本身是对的。可没等教授理清思路,GPT-5话锋一转“但对于人类而言,情况就不同了”……

接下来,GPT-5继续“热心”输出,却让教授越看越不对劲——不仅回复又长又刻意讨好,风格反倒更像GPT-4o,关键是其中夹杂着不少一眼就能看穿的错误,与OpenAI近期宣传的“和拥有博士级智力的得力朋友聊天”的体验,简直是天差地别。

随后,GPT-5又一次主动请缨,说要“绘制带有位置标记的旋转井字棋棋盘……这样你就能看到每种旋转如何影响玩家对棋盘的识别”。

最后结果是,这些图不仅完全混乱,还到处是拼写错误,出现了好几块毫无意义的空白棋盘。

Two More Things

有网友最近发现,OpenAI正在为ChatGPT开发一项名为“Thinking effort”的新功能,用户可自主选择ChatGPT的思考强度。

目前该功能已在测试中,现阶段共设有四个强度等级:light,内部属性值为5;standard,对应数值为18;extended,对应数值48;最高级max则达到200。

这些数值代表模型的内部“运算资源”配额。配额越高,意味着模型会执行更多运算步骤,通常能给出更深入的答案,但响应速度也会相应变慢。

其中,max等级设有使用权限限制,仅订阅价格为200美元的高级套餐Pro用户可使用。

另外,奥特曼最近在接受CNBC采访时开始炒GPT-6了,指出GPT-6不仅能响应用户需求,还能主动适配用户,允许用户创建符合个人偏好的聊天机器人。

他认为,记忆功能是让ChatGPT实现真正个性化的关键,并表示OpenAI正与心理学家密切合作以优化产品,团队会追踪用户在使用过程中的感受,并长期监测用户的使用体验变化。

值得一提的是,奥特曼表示增强版记忆功能是今年ChatGPT推出的他最喜欢的功能,但存在隐私隐患,尤其是临时记忆数据目前尚未加密。

对于应对方案,奥特曼只是模糊地说,加密功能“很可能”会在未来添加,但目前匝剔具体时间规划。

谈及未来方向,奥特曼提到自己比较关注脑机接口领域,同时对能源、新型硬件载体、机器人技术以及更高效的数据中心建设方式感兴趣。

他还提到ChatGPT的发展存在局限性:

这些模型在聊天交互这一应用场景上已经触及天花板,它们的表现不会再大幅提升了……甚至有可能会变差。


    24小时新闻排行榜更多>>
  1. 大曝光 阅兵风光背后的权斗与崩坏
  2. 以军内部文件曝光:我们失败了
  3. 习近平变“黑脸”被关注 使劲撑还能撑多久
  4. 美国的"新矿产主义":一份清单如何牵动全球供应链
  5. 王友群:又一个原中央军委副主席被抓?
  6. 洪都拉斯与中国签新协议 中国采购3千吨白虾保邦交
  7. 排便出现这4种异常,可能是肠癌
  8. 外卖大战:刘强东挑起战事后基本退出争夺,阿里却越打越兴奋
  9. 朝鲜高官女儿冒死逃亡 目睹同学妈遭公开处决恐怖情境
  10. 日公开富士山喷发AI影片 东京圈4千3百万人恐受影响
  11. 路透:Meta 擅制名人“情色”聊天机器人 涉及未成年
  12. 【名家专栏】中共悄然掌控俄远东地区
  13. 我国人工智能未来发展的制胜之道
  14. 齐人之福的背后?揭秘古人“三妻四妾”生活真相
  15. 美国国防部全面升级对中共侵蚀的反制战略
  16. 我在国企干“脏活”
  17. 美军将在日本部署“堤丰”系统
  18. 莫迪会习近平后见蔡奇 指欢迎恢复中印政党交流机制
  19. BBC:正以惊人速度扩张的中国海军会主宰海洋吗?
  20. 长周末首日,芝加哥再现血腥周末
  21. 声乐大赛金奖得主:感谢导师 金奖属于大家
  22. 以色列称已击毙哈马斯发言人奥贝达
  23. 川普新政 预估外籍生锐减四成 私立高校每月倒两所
  24. 2025年9月血月加日食 历史上的每一次都带着巨变
  25. 中国留学生持合法签证遭美遣返
  26. 全美最佳公立高中,惠特尼居加州之冠
  27. 100家公司扎堆炒股,那些不务正业的公司赚了多少钱?
  28. 中共主办上合峰会接着阅兵 折射其外交困境
  29. 德国总理:俄乌战争将持续很长时间
  30. 川普不出席峰会,石破茂骑虎难下
  31. 巴基斯坦政府直升机坠毁,5人罹难
  32. 揭秘烟台峰——志愿军与美军的真实交锋
  33. 这个世界冠军,中国队等了10年
  34. 英国三兄弟划船139天横渡太平洋 创世界纪录
  35. 谈到中国留学生,川普:要跟核大国搞好关系
  36. 重庆政协秘书长蓝庆华被查 系陈敏尔旧部
  37. 纽约真相展还原历史:抗日的是国军而非共产党
  38. 纽约市公校新学年 学生人均开支逾四万
  39. GPT-5“变笨”实锤
  40. 中南海官员怒吼“习近平下台” 美军想找张又侠对话
  41. 印度曾是"中国制造"的替代方案,川普改变了一切
  42. H20不卖了,老黄还怎么给英伟达画饼?
  43. 五十肩能自己痊愈?医生曝关键警讯与解方
  44. 普京习近平会谈,讨论俄美近期接触
  45. 改变选举规则!川普要签令"投票必须出示身分证明"
  46. 女骑手,2年激增36%
  47. 天安门广场布置已基本就绪
  48. 持续18个月,韩国医生“辞职潮”风波平息
  49. 2.5万美元以下最好的2025新车 本田Civic居首
  50. 700年古树砸扁“宝马”,车主也有错?
  51. 台湾2日凌晨2时起防中度磁暴 卫星导航恐中断
  52. 胡塞武装拘留11名联合国工作人员
  53. 青岛前副市长吴经建涉两宗犯罪被调查
  54. 郑祺蓉塞红包事件 亚当斯坦言行为不当
  55. 外媒看普京访华:“罕见”、“重要时刻”
  56. 这座一线城市,正在疯狂建大学
  57. 以色列考虑吞并约旦河西岸地区,以"报复"多国承认巴勒斯坦
  58. 纽约民主团体 谴责梁振英威胁事件及中共跨国打压
  59. 午夜时分天空一片血红 像极了史书中的异象
  60. 乌安全保障"美国承诺提供后盾",欧洲拟派联合部队