当AI账单失控,模型路由器成企业降本新宠

2026-07-04 04:25:10 · chineseheadlinenews.com · 来源: 华尔街日报

企业AI账单失控,“模型路由器”成降本杀手锏。该技术按任务复杂度智能调度大小AI模型,最高狂砍97%算力开支且不降质。目前巨头与初创全面入局,资本重金押注,这道“控费阀门”已成AI基建赛道不可忽视的新风口。

随着企业AI使用成本持续攀升,一类名为"模型路由器"的技术正迅速从边缘工具走向主流。这类系统能够根据任务复杂程度自动调配最合适的AI模型,在不显著牺牲质量的前提下大幅压缩开支,正在吸引从初创公司到大型企业的广泛关注。

模型路由器的核心逻辑在于:并非所有任务都需要最昂贵的前沿模型。总结邮件、检索文档等基础堡作完全可以交由开源模型或旧版专有模型处理,成本仅为顶级模型的一小部分。Snowflake和Palo Alto Networks等企业已向The Information证实,通过为特定任务替换更廉价的模型,实现了可观的成本节约。

这一趋势正在催生真实的商业回报。建筑公司McCarthy Building表示,通过Palantir的路由工具Evolve,其当季AI token使用量较去年同期减少了60%。Palantir自身也披露,在一个具体案例中,该工具通过将任务从OpenAI的GPT-5.1切换至更小的GPT-5.4 Nano模型,将计算成本压缩了97%。

从手动选模型到自动路由:一个行业转折点

模型路由器的概念并非全新,但真正走入大众视野,是在OpenAI发布GPT-5之后。该模型在ChatGPT内部根据用户提示的复杂程度自动在不同模型之间切换,将路由逻辑内嵌于产品之中。此后,能够跨多家供应商进行模型调度的路由器开始快速普及。

目前市场上的路由器形态多样:既有独立产品,也有云计算服务商内置的功能模块,还有企业IT部门自行搭建的定制化方案。这些工具的共同目标是替代用户手动选择模型的操作,从而在降低成本的同时维持输出质量。

Databricks推出的Unity AI Gateway便是其中一例。该公司CEO Ali Ghodsi表示,这款工具"非常受欢迎",原因在于许多企业"正在以过快的速度耗尽预算"。Databricks在向客户推出该产品之前,已在内部使用了一段时间。

从初创公司到科技巨头全面入局

路由器赛道正在吸引不同规模的参与者。据The Information此前报道,今年4月,提供路由技术的初创公司OpenRouter完成了1.2亿美元新一轮融资,资本市场对这一方向的热情可见一斑。

OpenRouter的"自动路由器"根据用户对成本与质量的偏好(在0至10的刻度上自行设定)来决定调用哪个模型。数据显示,该路由器约三分之一的时间会选择谷歌相对廉价的Gemini 2.5 Flash Lite,而调用OpenAI更强大的GPT-5.5的比例仅约10%。OpenRouter的自动路由器底层由初创公司Not Diamond提供支持,后者专注于为AI编程智能体开发路由系统。

日本AI实验室Sakana AI近期发布了一套基于路由器的多模型协同系统。该系统在测试中将数学问题主要分配给OpenAI的GPT-5.5,将科学问题分配给谷歌的Gemini,理由是系统判断这两个模型在各自领域优于其他选项。Sakana AI称,该系统整体表现在编程、工程、科学任务和推理等基准测试上与Anthropic的Fable 5和Mythos Preview模型"并驾齐驱"。

AI编程应用Cognition本周也发布了新路由器,利用其内部基准测试识别不同智能体的相对优势,并引入一个"sidekick"智能体处理较简单的任务。Cognition表示,该路由器在某编程基准测试上达到了Fable 5的得分水平,成本却低了35%。

DIY路由,低成本方案同样奏效

并非所有企业都需要购买专业路由产品。开发者可以使用Claude Code等AI编程智能体自行搭建路由器,甚至直接让一个AI模型来决定哪个模型最适合处理某个特定查询。

Arcee AI负责AI智能体工作的Hunter Bown表示,他习惯使用DeepSeek V4 Flash来进行模型选择,原因是其成本低廉。他的做法是向DeepSeek提供一份模型列表,让其判断哪个模型最适合处理当前提示。

不过,这类"快速搭建"方案也有其局限性。路由器提供商Martian的创始人Shriyash Upadhyay指出,更复杂的路由器有时会展示出亮眼的基准测试成绩,但实际表现未必与之相符。他还提到,即便是更精密的路由器,仅凭用户的第一条提示来预测最佳模型也颇具难度。

Upadhyay表示,模型迭代速度快、能力差异持续变化,使得路由决策愈发复杂。"各家公司没有关于所有不同任务的无限数据,因此你必须真正深入模型内部,弄清楚这些模型擅长什么。"为此,Martian在做路由决策时,不仅参考模型的输出结果,还会考量构成这些模型的内部计算过程。

成本压力持续,路由器需求料将扩大

企业对AI成本的焦虑并非短期现象。随着员工对高级AI模型的使用量(即"tokenmaxxing"现象)持续增加,管理层对AI支出的审视也在加强。这一背景为模型路由器提供了持续的需求驱动力。

Palantir的Evolve工具在路由功能之外,还能根据所选模型自动调整提示内容,并防止请求被重复发送给模型——后者是导致超额收费的常见原因之一。McCarthy Building的案例表明,通过优化提示结构,企业可以在使用前沿模型时消耗更少的token,同时获得相同的输出结果。

对于投资者而言,模型路由器赛道的升温意味着:一方面,OpenRouter等专注路由技术的初创公司正在获得资本青睐;另一方面,Databricks、Palantir等将路由功能整合进企业AI平台的公司,也在以此强化其产品竞争力。随着AI基础设施支出持续扩张,帮助企业控制这一支出的工具层,正在成为不可忽视的新兴市场。


    24小时新闻排行榜更多>>
  1. 习火速晋升两上将 又添身带弓之人 增补军委时间猜测
  2. 中国船员被韩海警扣押期间死亡 家属质疑延误救援
  3. 克罗地亚:我们被抢劫 FIFA保送葡萄牙 C罗靠施舍
  4. 证监会就再融资改革征求意见
  5. 婚内强行性行为,男子被羁押15个月
  6. 阿根廷加时3-2淘汰佛得角!黑马两度追平昂首出局
  7. 香港名媛道歉:绝无丑化或炒作意图
  8. 霉霉世纪婚礼,行程表+细节流出
  9. 蒋方舟回应“论文造假”指控
  10. 华尔街或重演2024惊魂一幕
  11. 美国警告:俄罗斯可能要入侵波兰
  12. 要民众冷气开25度以上 纽约市政大楼冷到剩12度
  13. 埃及战胜澳大利亚,晋级十六强
  14. 50万买9系SUV,到底值不值?
  15. 日本在留政令出炉:大幅加价
  16. 梅西领衔阿根廷 迎战黑马佛得角
  17. 美以签约建耶路撒冷永久大使馆 1美元租借99年
  18. 遭美国反对,委反对派领导人回国飞机被迫掉头
  19. 13亿美元印度项目遭欠款多年 上海电气反被索赔
  20. 提升学生体质健康,运动效果远超预期
  21. 藏人男子在纽约联合国总部前自焚 抗议中国政府
  22. 欧洲遭“最严酷的热浪”袭击之后
  23. 多伦多热浪升级
  24. 暴露野心 波兰总统办公室主任称乌克兰领土“小波兰”
  25. 清华教授举报蒋方舟论文造假 人大方面很难再拖了
  26. 俄罗斯正计划对波兰发动攻击
  27. 从保守派宠儿到MAGA公敌 她为何敢“背叛”川普?
  28. 别被“今日限定”“买一送一”骗了 专家揭陷阱
  29. 女子划船横渡太平洋,海警为她庆生
  30. 民族团结法引争议:北京指责批评者“散布谎言”
  31. 绝对忠诚破产 习七一讲话再暴露统治危机 四段论惹议
  32. DeepSeek新技术移植苹果芯片
  33. 北京一天内经历“冰火两重天”
  34. 知名女企业家郭恒华遭刑拘 曾参与成立“巾帼系”
  35. 俄乌阶段性战损比或接近8比1 双方总伤亡超200万
  36. 香港网红向郭富城夫妇道歉
  37. 华商维权见效,意大利警方清场解封货物
  38. 美超炎热天气持续 多个城市气温破记录 纽约逾38℃
  39. 2026.6.26 北京仲夏夜悬案解读
  40. 一天3款新车上市,造手机的都沉默了
  41. 安省油价本周末维持$1.63
  42. 川普将在总统山发表演说
  43. 高市“盯上”印度牛粪:靠牛粪就能让汽车跑起来
  44. 大开眼界!史上最著名的10大急智对联
  45. 最近让台湾人焦虑的一篇《经济学人》
  46. 起底年销125亿的西部第一商场西安赛格
  47. 美股遭遇最大单周资金流出
  48. 新材料重大专项申报工作启动
  49. 热浪搅乱独立日,美多地取消庆祝活动
  50. 前清华大学副教授因涉嫌“唱衰大陆经济”被封杀
  51. 很罕见,普京突然穿上了军装
  52. 阿里巴巴同意付6亿美元 了结在美非法药物销售指控
  53. 小飞机撞北京最高楼?驾驶小型飞机这几点要注意
  54. 阿省放弃北线方案
  55. 脆皮中年人,集体过上三无生活
  56. 汽车工人现状:高压、昼夜颠倒,与没有社保的20元时薪
  57. 微软、字节都在高薪招人,AI又衍生了一个新岗位
  58. 佛得角:一个无法被遗忘的角落
  59. 红靴子
  60. 黄仁勋的招牌黑皮衣登苏富比拍卖 最高成交价估6万