“Token”发工资,有人慌了
2026-03-24 10:25:29 · chineseheadlinenews.com · 来源: VISTA看天下
不到两个月,“Token”这个原本只被AI行业熟知的黑话,就以前所未有的速度席卷了所有人的生活。
Token是AI理解世界、说话干活的最小单位,好比游戏角色的血条。

当“每一句话都有价格”这件事变得可量化,人们也开始意识到另一件事,被消耗的,其实不只有机器的Token。(图源:《轧戏》剧照)
3月16日,阿里巴巴宣布成立Token事业群,并计划向员工提供Token额度,鼓励员工使用先进的AI工具。在大洋彼岸的英伟达GTC 2026大会上,英伟达创始人黄仁勋发表了两个小时的主题演讲,其中至少提到了70次“Token”,认为Token将成为未来工程师薪资的一部分。

黄仁勋在英伟达GTC 2026大会演讲
Token还成了年轻人“养龙虾破产”的幕后黑手。
“龙虾”指的是AI智能体OpenClaw,号称“24小时打工神器”。你装上它之后,只要在聊天框里动动嘴,它就能自动帮你写邮件、管日程、刷消息。
但很多尝鲜的年轻人,“龙虾”没养明白,钱包先被榨干了。
一位用户在社交平台上发帖称,周末在电脑上安装了“龙虾”,一晚上就问了几句好,查了一些价格数据,就收到了欠费邮件,账户显示Token的可用额度直接变成负数。一位深圳用户刚装上3天,不仅API(应用程序编程接口)的密钥被盗,还收到了一笔1.2万元的账单。
大厂们纷纷跟风,生怕输在起跑线上,互联网上,媒体和网友也都在为Token取中文名。《人民日报》把Token译作“词元”,网友们脑洞大开,争相整活,有人认为可以叫作“模丸”“智子”,有人认为Token可以叫“偷啃”,因为它是真的在“偷偷啃”用户的真金白银。
随着Token被熟知,有网友开始把人的“精力”“情绪价值”都叫作Token。当AI世界的每一次消耗都被Token量化,大家突然意识到,自己每天的耐心、注意力、表达欲,也相当于一种Token。

图源网络
当你为了推测领导意图而字斟句酌,把一段话改八百遍,当你与不熟的人寒暄还强颜欢笑,甚至是你无意识地刷短视频时,你都在消耗心力。这样说来,人类这一天的Token消耗量怎么也要千万级起步,但可没人给自己充值。
Token量化的不只是AI算力,也是我们每个人的生活。这个迅速火遍全网的Token到底是啥意思?对普通人又意味着什么?
01
“知心姐姐”只是在切割你的话
“我觉得自己特别失败,好像做什么都不对。”凌晨,小静刚结束工作,满腹委屈无法诉说,于是打开了AI对话框,敲下了自己的烦恼。
“这不是你的错。在这个快节奏的世界里,感到疲惫是正常的。你刚才提到的那件事,其实恰恰证明了你的责任心强……”不出1秒,AI就用一段温暖治愈的文字,稳稳地接住了要碎掉的小静。AI似乎总能听懂并回应打工人的需求,有时,它甚至能理解情绪。
然而,残酷的真相是,这个倾听者并不具备“温柔的灵魂”。AI从头到尾只在做一件事,切割语言。
当小静输入“我觉得自己特别失败”时,AI并没有像人类朋友那样心头一紧。它只是迅速将这句话拆解成了几个独立的编号“我”“觉得”“自己”“特别”“失”“败”。在它眼里,这不是一句伤心的倾诉,而是一串待处理的数学序列。

AI分词成Token的示例(AI生成)
它之所以能回应得如此贴心,不是因为它懂你,而是因为它在海量的数据库里,计算出了在“失败”这个编号后面,接上“安慰”类编号的概率最高。
这种被切割后的最小语言单元,就是Token。
Token就像AI的积木,组合在一起可以成为任何东西。AI会把我们输入的一句话,拆成一个个Token,再逐个预测下一个Token,最终拼成完整回答。而拼这些“积木”,靠的就是AI公司天天挂在嘴边的“算力”,算力越足,拼得越快、越准,烧的Token也越多。
“龙虾”在前台卖力打工时,哪怕是最简单的指令,燃烧的Token也不少。根据澎湃新闻,“龙虾”每完成一次分析任务,一般需要消耗300万左右的Token。你让它一晚上自动处理微信消息,哪怕只是回几个“嗯嗯、好的、晚安、哈哈”,可能都要花几万Token。有网友表示:“和‘龙虾’说一次‘你好’就要花200多Token。”

AI生成
Token的天花板,就是AI能记住多少事情、做多复杂事情的天花板。这在一项叫作“大海捞针”的测试中尤为明显。“大海捞针”专门用于大语言模型性能评测。想象一下,你给AI一本几百页厚的书(这就是“大海”),然后在书的随机某一页里,悄悄插入一句毫不相关的话,比如“秘密代码是蓝色大象”(这就是“针”)。
表面上看,所有模型都读过这本书,结果却截然不同。
一些Token较小的模型,往往在开头和结尾表现良好,却很难找回中间那句关键信息,就像翻书时只记住了目录和结尾,却把最重要的内容遗漏。而Token更大的模型,则更有可能在整段文本中精准定位,甚至还能指出这句话大概出现在什么位置。
在相关测试图中,红色区域代表模型“没找到那根针”的位置。红色越多,说明模型越容易在长文本中“看过却没记住”。

Claude-2.1的“大海捞针”测试,红色越多,代表AI犯的错越多。(图源 知乎@xyjz)
这也解释了为什么Token的大小,决定的不只是AI能读多长,而是在长上下文环境下的信息提取和记忆能力。
早期的AI模型只支持4K Token的上下文窗口,约等于一篇几千字的文章。这意味着,AI一旦处理长文本,就会出现断片的情况,甚至让用户产生“它是不是在偷懒”的错觉。如今,顶级AI模型的Token容量已经突破百万,能一口气读完《红楼梦》全文,已经能完成复杂的长文本处理、多任务联动。
Token在硅谷已经成了一种新型货币。OpenAI内部已经出现了Token消耗量排行榜,而位居榜首的员工一周之内就能消耗2100亿Token,足够把整个维基百科填满33遍。

图源 英伟达官网
英伟达CEO黄仁勋也在GTC 2026大会中提到了Token的重要性。“在未来,我们公司的每一位工程师都需要一个年度Token预算。他们的基础年薪可能是几十万美元,我会在此基础上再拿出大约一半的金额作为Token额度给他们,让他们实现10倍的效率提升。”
他认为,“offer里带多少Token”已经成为硅谷的新招聘筹码,哪个公司掌握了Token的生产力,他们就掌握了AI时代的主动权。
02
得Token者,得天下?
以前使用AI App时,很多人只关注功能是否好用,毕竟大部分App都是免费的。但想要使用“龙虾”,用户就需要先在大模型厂商那里充值,获取API密钥,再将其填进“龙虾”的配置里。之后,“龙虾”每调用一次大模型来思考或干活,就会从你的账户里扣除对应的Token。
猎豹移动CEO傅盛在今年过年期间,开始把“龙虾”应用到工作中,用14天打造了由8个AI智能体组成的团队,并产出了超过10万阅读量的公众号推文。但他在直播中表示,自己在训练“龙虾”期间,每天都要烧掉100到200美元的Token费用。这让人直呼“现在的Token消耗,就像2009年一个月30M的2G流量,又贵又不够用”。

有海外用户设置“龙虾”每30分钟自动检查一次有没有新任务,但第二天早上醒来后发现,“龙虾”一晚上烧掉了18.75美元,但进行的25次检查,每次的结论都是“没有任务”。
问题不在于AI“变贵了”,而在于用法变了。
和传统聊天模型不同,这类智能体不是“一问一答”,而是在后台24小时持续运转,来拆解任务、联网搜索、调用工具、校验结果,再循环执行。它更像一个不会关机的程序,而不是一个随叫随停的对话窗口。
于是,Token的消耗方式发生了变化,从按次计算,变成了持续流动。截至2026年2月,中国日均Token消耗量达到180万亿级别,而2024年初只有1000亿。

图源 每日经济新闻
消耗量的暴增,也给AI厂商的商业化变现打开了全新突破口,让曾经模糊的盈利路径变得清晰可见。今年1月底到2月的20天内,AI公司月之暗面的收入超过了2025年全年总收入,驱动力正是Token消耗的爆发式增长。
为了让用户购买Token,大模型厂商们也使出了浑身解数。
3月14日,360集团发布“360安全龙虾”等产品时,现场甚至摆满了小龙虾玩偶和熟食。创始人周鸿祎一句“我们不是来赚钱的,我们是来交朋友的”,把发布会变成了直播带货。他随后公布入门套餐定价169元,“不是2999元,也不是1999元”。
3月11日,国家超算互联网(我国首个集算力、网络与服务于一体的国家级算力服务平台)宣布面向平台的全体“龙虾”用户,免费发放每人限时2周总计1000万Tokens额度,续购价格也只需0.1元/百万Token。

周鸿祎在360的安全龙虾发布会上演讲(图源网络)
普通用户看到的账单,其实只是冰山一角,更为庞大的,是模型公司在另一端的支出。
训练一个顶级大模型,需要消耗数百亿Token,对应的算力成本往往以亿元计。因此,阿里巴巴宣布未来3年投入超3800亿元建设云与AI能力,字节跳动2026年的资本支出预计也将达到1600亿元。
而Token价格也在近几年不断变化。2025年初,DeepSeek用约560万美元的训练成本,实现了接近GPT-4的性能水平,GPT-4的训练成本曾被估算为超过1亿美元。这种差距,直接展开了Token价格战。
有厂商直接将Token价格砍掉一半,有的推出套餐包,有的提供免费额度。只有把训练和推理成本压低,才有空间降低用户价格,而用户规模一旦扩大,成本又会被进一步摊薄。
如今,阿里巴巴旗下的Qwen-Plus,100万Token的价格从2024年的20元降到了0.8元。
但“龙虾”火爆带来的算力需求,让降价潮戛然而止。腾讯部分模型最近涨幅高达463%,阿里云AI算力最高涨价34%。降价和涨价交替上演,表明了谁能在Token这场仗里占据主动,谁就能决定AI的普及速度和方向。
一场围绕Token的互联网大厂大战,又已开启。当智能体开始烧Token,打工人也开始琢磨,我回你个微信,值多少Token呀?
03
“社交Token焦虑”
“i人在交流中消耗Token,e人在交流中获得Token,和不讲理的人交流是在浪费Token”“那e人和e人交流就是永动Token”,最近,类似的Token段子在网上流行。
你坐在会议室里,听着领导车轱辘话来回说,整整两个小时,没有任何结论,领导还时不时点你名让你发表看法。你在餐厅团建,听着无关紧要的寒暄,说着言不由衷的客套话,全程强装微笑,明明浑身疲惫,却不能提前离场。过年的家庭聚会上,你被七大姑八大姨围着追问工资、对象、买房进度,明明不想回应,却还要强装热情,一遍遍地重复“还好”“不急”“再看看”,聊完只觉得身心俱疲……
在Token出现之前,每当被这种疲惫裹挟,我们只能笼统地说“有点累”。而现在,一种新的表达方式出现了:“我的Token用完了。”这句话听起来像玩笑,却提供了一种更具体的解释,不是我不愿意回应,而是我没有足够的资源继续投入了。

这种“消耗感”,其实和我们使唤AI时的体验类似。去年,大家使用AI时,压根儿没想过“这句话值不值”的问题,而现在,连对AI说句“谢谢”都会被教育是“浪费算力”。越来越多的人开始下意识地权衡,这句话要不要多问一句,这段话值不值得再让AI多写几行。一次对话,不再只是信息交换,也隐约变成了一次成本决策。
当“每一句话都有价格”这件事变得清晰,人们也开始意识到另一件事,被消耗的,其实不只有机器的Token。
在现实生活中,人类的每日Token,也同样是有上限的。一次沟通需要时间,一段关系需要反复投入,就像AI做事需要Token一样,这些看不见的资源,也在不断被使用、被消耗。
跟一个人交流的时间越长,你们之间的“共同上下文”越丰富,一个眼神能传达3段话的意思,一个表情就能接住对方没说完的话。这种默契,是用大量Token积累出来的。就像AI需要足够的Token才能精准回应,我们也需要足够的精力和时间,才能维系一段舒服的关系。

图源 《老友记》剧照
而久未联系的朋友,每次重新开口都要“重载上下文”。有些人即便重新联系了,也像是打开一个需要更新的软件,卡在那里转圈,进不去。
同样是对话,带来的体验却天差地别。有些对话结束后你充满能量,有些让你精神宕机,说了一晚上等于什么都没说。前者在给你的Token充值,后者是耗尽你上下文窗口的寄生程序。
让人无奈的是,如今很多人都被“无效社交”裹挟,疯狂消耗着自己的社交Token,甚至会产生一种“社交Token焦虑”。
每天打开手机,群聊里就算没有任何有价值的内容,却不得不时刻关注,生怕错过重要信息,主打一个“被动消耗社交Token”。那些不得不回复的客套消息、不得不参与的无效聚会,这些都在疯狂消耗着我们的社交Token,堪称“社交Token刺客”。

图源《甄嬛传》
也正是在这个意义上,Token完成了一次转变,它不再只是AI系统里的计量单位,也成为人们理解自身状态的一种语言。
有网友直言:“在AI出现之前,人从未意识到自己的Token很值钱。”