AI集体押注世界杯

2026-06-11 11:25:45 · chineseheadlinenews.com · 来源: 每日经济新闻

还有几个小时,2026年美加墨世界杯即将打响(北京时间6月12日凌晨)。而赛场外的AI(人工智能)赛事研判、实力比拼,早已先行开启。

6月8日,国产大模型Kimi称将通过Agent(智能体)集群同时调度300个子Agent,公开预测104场世界杯赛事,并提出德国队或爆冷夺冠。Kimi同时上线了一场“押注”活动:1万亿Token(词元)奖池,用户选队、球队赢了就可以瓜分Token,将体育赛事与AI用户运营深度绑定。

《每日经济新闻》记者(以下简称每经记者)注意到,千问也紧随其后上线了相关活动。每经记者实测发现,豆包、元宝、DeepSeek、文心一言等国产大模型在被问及“2026年世界杯谁会夺冠”时,多数预测答案为“西班牙队”,判断逻辑也高度趋同。

热闹之下,Kelly Bench最新数据却显示,包括GPT等在内的顶级模型在足球赌盘上表现惨淡。

既然AI赌不赢,Kimi、千问等AI大模型为何还要押注世界杯?这背后,实际上是AI大模型行业的集体焦虑:当写诗、做题、对话的“内卷”走到尽头,各家厂商急于证明自己能够理解复杂、动态、充满不确定性的现实世界。

“万亿Token狂欢”:世界杯成AI“用户拉新战场”

面对世界杯的巨大流量,一众品牌早已摩拳擦掌,这一次下场“押注”除了传统赞助商,还有手握万亿Token的AI大模型们。

6月8日,Kimi发文称,将通过Agent集群同时调度300个子Agent,公开预测104场世界杯赛事,并在每轮赛前公开预测、赛后复盘。

Kimi的预测策略并没有完全随大流。它并未否认当前多数主流模型将西班牙队和法国队列为夺冠最大热门,同样认为两者的夺冠概率位居前列,但它提出了另一个关注点:德国队的夺冠概率可能被市场低估。

Kimi月之暗面公众号

当网友们热议“AI预测究竟准不准”“AI懂不懂球”时,Kimi在文章开头就坦承“我们的预测很可能是错的”,并称希望通过这次尝试,把分析过程、预测结果和赛后复盘放在同一个透明框架中。

此外,Kimi还拿出1万亿Token奖池,用户预测冠军队、pick(挑选)的球队每次获胜就可以参与瓜分Token。截至6月11日18时,Kimi App显示,实时排行的队伍支持率TOP5分别为阿根廷、法国、西班牙、巴西、葡萄牙,有43.33%的参与用户选择了阿根廷。

Kimi“预测冠军队抢万亿Token”活动截图

那么,Kimi押注世界杯并豪掷万亿Token,究竟是能力展示,还是一次品牌营销?

长期关注世界杯等知名赛事的体育咨询专家、关键之道创始人张庆告诉每经记者,Kimi此次活动类似于春晚抢红包、集福瓜分奖金等互联网平台常用打法,更像一种营销活动。

“每一届世界杯都是巨大的流量池,各个企业都希望有机会参与,获得更多曝光、引流机会。而大模型天然适合做这类数据分析和预测。”张庆向每经记者指出,当下,大模型竞争激烈,尤其是用户注意力和使用频次的竞争,通过世界杯一方面会加持品牌声量,另一方面也有利于提升大模型的数据用户积累和活跃度。

深耕人工智能产业多年的技术专家王岩(化名)在接受每经记者采访时坦言,大模型预测世界杯冠军,是体育热点、Token补贴和Agent展示叠加形成的传播事件。

王岩认为,热点借势只是入口,真正竞争点在于谁能把抽象模型能力转化为用户可感知结果。这意味着,AI大模型企业在品牌传播上,不再只发布参数、榜单和技术报告,转为借高关注赛事制造用户体验入口;而在商业竞争上各家模型争夺的则是用户心智、使用频次、社交传播和开发者注意力。

截至目前,多少用户参与了Kimi“押注”世界杯的活动?通过用Agent集群预测世界杯冠军,Kimi又将获得哪些方面的能力提升?Kimi(月之暗面)方面向每经记者表示:“匝剔回应”。

多款国产大模型预测西班牙队精准共识还是算法趋同?

不只Kimi,其他AI大模型玩家也试图“分一杯世界杯的羹”。例如,千问也推出“决战美加墨,与千问一起预测,赢万元现金”的活动,加入这场AI“秀肌肉”争夺战。

千问App截图

“我前两天也用DeepSeek、豆包预测了2026年世界杯冠军,想对比它们谁分析的有道理,但我看到它们给出的预测和相关理由都有明显局限性。”张庆向每经记者分享道。

在国产大模型眼中,谁是“2026年世界杯冠军队伍”?每经记者实测DeepSeek、Kimi、豆包、元宝、千问、文心一言、智谱清言发现:DeepSeek押宝法国队,Kimi看好阿根廷队,而千问、豆包、元宝、文心一言、智谱清言5款国产大模型则均预测支持西班牙队。

每款AI大模型给出的“夺冠队伍”理由分析略有不同。值得注意的是,投票西班牙队的AI大模型们,其判断逻辑高度趋同,核心理由之一均为“权威数据模型、机构高度一致看好”。

大模型的预测到底准不准?能否获得球迷的青睐?

上海财经大学特聘教授胡延平向每经记者表示,AI大模型已经初步展露出基于全局动态信息和深度复杂推理的特定预测能力,使得各家大模型有基础、有信心来进行预测,但足球是圆的,预测的成功率、精准度方面还有待观察。

“世界杯预测无疑是展示模型与智能体水准的一个上佳机会窗口,不过预测的效果也是一把双刃剑。个人预期这届世界杯,水准最高的预测模型,成功率能达到60%~80%左右。”胡延平坦言。

不过,Kelly Bench在2023—2024赛季英格兰超级联赛的模拟中显示,其评估的每个前沿模型在整个赛季都亏损了,并且许多都经历了破产。其中,Claude Opus 4.7目前以-3.7%的平均投资回报率领先;有4个模型避免了所有的破产。

Kelly Bench截图

“AI更多是一个辅助工具,基于战队历史战绩、世界杯排名、赔率、国际足联等大量数据的多维度预测,AI大模型呈现了客观数据统计,所以作为参考工具还是有意义的,但不会完全依赖它的结果。”一位长期关注世界杯的资深球迷告诉每经记者。

在上述球迷看来,相比大模型的预测,每个球迷都更青睐自己喜欢的球队,喜好也会占一大部分判断,而且越到决赛越是球员临场发挥和心理上的博弈,不确定性太多了。

不再比谁更会“聊”押注世界杯背后AI们集体想拼什么?

当Kimi拿出万亿Token、调动300个子Agent对世界杯赛事进行并行预测,当千问、豆包、元宝争先恐后地给出各自的夺冠热门队伍时,这场看似娱乐化的“AI押注战”背后,AI大模型厂商究竟想“秀”什么?又在集体“卷”什么?

“本轮大模型预测世界杯冠军,是生成式AI从问答工具走向公共事件运营的典型样本。”王岩向每经记者指出,公众看到的是冠军预测,企业展示的则是Agent协同、长上下文处理、实时检索、概率解释和高并发服务能力,商业上争夺的则是用户时长、付费转化和资本叙事。

Kimi月之暗面公众号

当下,AI大模型的竞争早已不局限于单纯的参数榜单,而是从“会聊天”转向“能办事”,从“比模型”转向“比场景”。然而,《Build for the Future 2025》全球研究显示,在调研全球1250多家企业后,仅5%的公司实现了AI价值的规模化应用。Gartner数据也显示,截至2025年底,嵌入真正AI Agent的企业应用占比不足5%。

胡延平观察到,大模型和智能体正从对话走向任务,从预训练走向持续学习,从数据语料走向持续多维的现实感知。“预测世界杯这类探索项目会加速这个进化过程。未来行动智能体所需要的能力体系,也是在走向‘感知-交互-决策-协同’这个方向。”

不过,王岩坦言,世界杯预测可以成为Agent能力的公开压力测试,但不能自动证明Agent能力提升,大模型在这场押注中训练和检验的是长任务组织、概率校准和用户交互能力。

“Kimi的300个Agent代表分析覆盖面增加,不直接代表预测准确率提升。相关Agent任务Token消耗研究显示,同一任务的Token消耗可相差几十倍,更多Token并不必然带来更高准确率。同样,相关Prediction Arena研究也显示,多个前沿模型在Kalshi真实预测市场57天交易测试中最终收益为-16.0%至-30.8%,研究量与结果没有相关性。”王岩向每经记者进一步分析道。

正如王岩所言:“当前Agent的最大缺口,正在从‘能否给出合理计划’转向‘能否稳定完成长周期真实任务’。”这意味着,谁能率先落地“实战能力”,谁就将有机会在愈发激烈的争夺赛中脱颖而出。


    24小时新闻排行榜更多>>
  1. 重庆市民抗议虐狗男,遭警方抢夺手机、暴力拖拽
  2. 中国存储穿越被围堵的10年
  3. 广西爆炸已增至7死30余伤 坊间传为报复社会
  4. 中共操纵舆论 煽动美民众抵制关税和数据中心
  5. 日央行长因病“错过”利率决议
  6. “女主播遭快递盒爆炸烧伤案”更多细节曝光
  7. 离谱!加航机长“无照”飞17年、900航班才被抓
  8. 奔赴开罗,探秘解锁古埃及神秘历史
  9. 广西桂林发生大爆炸 酿7死17伤惨剧
  10. 胰腺癌迎来历史性突破
  11. 台湾军方举行沿海演习
  12. 印度取消对中豁免,想空手套中国技术
  13. 美联储降息还是加息?经济学家看法不一
  14. 美军周三对伊朗多个目标发动新一轮空袭
  15. 谷爱凌遭美国邻居投诉,人行道“乱摆”杂物
  16. 杀妻为何难偿命:婚内命案“少杀慎杀”这二十余年
  17. 世界杯开幕式 三国三地精彩表演等你看
  18. 湖南建投董事长蔡典维落马 两名老领导投案
  19. 61岁,被工地清退后,新规来了
  20. 赫格塞思视察位于古巴的美军基地
  21. 世界杯就要开幕了 有哪些亮点一文看懂
  22. 伊朗公布最新海上损失情况
  23. “残障老人被奴役20年”通报来了,好一个“同处居住”
  24. 【百年真相】中共越反越腐三大现象四大原因
  25. 美驳斥伊朗谣言:无美舰遇袭 海峡未关闭
  26. 狂风80迈横扫芝加哥,25万户停电
  27. NBA总决赛开打,纽约MSG周边全面大封锁
  28. 中国造船业的燃眉之急 下一代工人到哪去找
  29. 外交部:日本这一动向十分危险
  30. 上海又一高官落马 副市长陈宇剑遭中纪委调查
  31. 清迈豪宅藏中国人诈骗机房 跨国黑产害同胞
  32. 当科技试图改写生命 古老预言正在实现
  33. 卖鸭腿的“鹅腿阿姨”,以后怎么面对清北学生
  34. 世界杯梗最多的男人,靠狂野长相在全网横行霸道
  35. UFC即将开打:白宫南草坪拥有悠久的体育历史
  36. 单车撞上黑熊,骑士昏倒熊跑了
  37. 川普不担忧通货膨胀,放言:我爱通胀!
  38. 中移动港卡禁内地激活 中共阻“翻墙”引关注
  39. 美国会委员会审议《2027年国防授权法》
  40. 中国"男色经济":女性欲望如何变成一门生意?
  41. 美军澄清:无美舰遇袭 海峡仍通行
  42. 美将188中企列黑名单 分析:封堵中共AI生态链
  43. 川普:80岁生日愿望是世界和平
  44. 大陆演艺圈真相扎心!胡歌笑谈转行 李冰冰愿免费拍戏
  45. 伊朗队备战世界杯全历程:坐40小时长途大巴离境
  46. 美司法部、联调局查封13个涉嫌中国特工经营网站
  47. 民国军队中的副官到底是干什么的?
  48. 东方甄选又一位主播离职,此前四名核心主播已出走
  49. 【翻墙必看】中共用机器换人致就业雪上加霜
  50. 戴安娜王妃曾秘会肯尼迪二世,折服当年“最性感”男士
  51. 中国限制磷化铟出口 影响全球AI数据中心建设进程
  52. 川普称80岁生日愿望是世界和平,自称"热爱和平"
  53. 台积电5月营收4,169亿元 创历史新高
  54. 杨宝峰院士:论文只是“副产品”
  55. 【中国观察】禁境外访问的官网藏何秘密?
  56. “百亿补贴”并非真百亿,五家平台被约谈
  57. 大陆电商平台再现乱象 “百亿补贴”补了谁?
  58. 课堂“杀哥”事件后 郑州高校老师因言语致男生崩溃怒吼
  59. 医生揭密:这些日常食材不煮熟竟藏毒
  60. 受伊朗攻击影响,科威特暂时关闭领空