AI账单暴涨,实际效益难言:谁在助推“Token通胀”?

100000000000000。

100万亿,1后面跟着14个0。这无疑是个天文数字,但可能还不到国人每天Token消耗量的一半。

2026年上半年,从中关村到硅谷,大厂茶水间里最热的话题变成了一句:“你今天烧了多少?”几十万、几百万、几千万?旁边桌吃饭的骑手听见了,大概率以为这哥们在吹牛,或者脑子有毛病。其实没扯谎,他们聊的不是人民币,是Token。

Token和真金白银之间虽然隔着数量级,但架不住后面的0涨得太凶。据报道,国外一家企业给员工批量开通Anthropic的Claude企业授权时忘了设消费上限,一个月后账单出来——5亿美元,约合人民币34亿元。

国内近期有个案例是米哈游,《崩坏》系列技术团队负责人郑银河在2026年5月阿里云峰会上自曝:一名工程师测试多Agent协作时没设置熔断,数十个智能体陷入循环调用,13小时烧掉200万元Token账单。

账单炸了,但问起AI带来了什么实际效益?多数人可能会面露尴尬。米哈游工程师烧掉的200万元,足够支付一个小型研发团队整月的薪资,最终换来了的却只是一整夜毫无产出的“AI摸鱼”。

或许,企业里只有HR完成了裁员KPI,老板转头把省下的人力成本又砸去建AI、买Token。

单位价值稀释,消耗规模指数膨胀,投入与产出错位——Token作为AI时代的硬通货,正呈现出典型的通胀特征。而且其通胀程度,可能比津巴布韦人民扛一麻袋钱买大米还要疯。

那么,到底是谁在为“Token通胀”推波助澜?

01

 

「从极大化使用,到限量使用」

2026年上半年,硅谷刮起一股名为”Tokenmaxxing”(极大化Token使用量)的风潮。大厂们主动鼓励员工尽可能多地消耗Token,甚至将Token消耗量与KPI直接挂钩。

Meta内部上线了追踪8.5万名员工Token消耗的排行榜,给排名靠前的员工授予“Token传说”“缓存大师”等称号;亚马逊推出内部AI使用榜单“KiroRank”,将消耗数据纳入团队考评。

英伟达CEO黄仁勋的言论更火上浇油:”如果我的工程师消耗的Token价值达不到他们年薪的一半,我会深感忧虑。”

国内厂商迅速跟进。腾讯在2026年3月推出全员AI激励计划,为员工提供每人年均22万元的Token资源,覆盖Cursor、CodeBuddy等多款国内外工具,内部也一度出现Token消耗排行榜。

于是,不出意外的,它们的AI账单,都失控了。

短短30天,Meta员工消耗了60.2万亿token,成本超1亿美元;Uber仅用4个月就耗尽了2026年全年的AI预算,管理层不得不紧急出台限额令,每位员工每月AI工具费用不得超过1500美元;亚马逊也开始推行严格的Token限额管理,高级副总裁Dave Treadwell甚至亲自下场喊话“别为了用AI而用AI”。

就在上个月,腾讯内部也下发额度调整通知:全员Token配额大幅缩水,核心研发团队月额度从宽松状态收紧至7000元,外包岗位更是砍到1000元。

从全员敞开用,到限额使用,短短三个月,画风突变。究其原因,无非是飞起的账单让财大气粗的大厂们都头皮发麻。

正如OpenAI CEO山姆·奥特曼近日在一个企业客户活动上所说:“今年年初,AI运行成本还是一个从未被提起的问题,现在突然变成了一个巨大的问题。”

这背后是需求的爆炸式增长。国家数据局数据显示,2026年3月中国日均Token调用量已突破140万亿,而2024年初仅为1000亿,两年增长超千倍。

而从全球范围来看,这个增长趋势还未看到放缓的苗头。高盛近期发布的报告,预计到2030年,全球Token月消耗量将比2026年增长24倍,达到约120千万亿(120 quadrillion)个Token/月,其中企业级智能体是核心增长动力。

Token账单失控还带来一个副作用。为了填平AI的成本窟窿,今年一季度,海外十几家科技巨头裁员超4万人,程序员首当其冲;而在国内,“630”成了不少互联网人共同的Last Day。

在Meta,已经几乎没有人手写代码;在国内头部大厂,新增代码中最高90%由AI生成。AI代码率的飙升,直接导致了人员需求的下跌,以及随之而来的职场震荡。

 

02

 

「Token账单暴涨之谜」

账单费用=用量 X 价格。这道简单的公式背后,藏着两层不那么透明的推高逻辑,最终叠加形成了指数级的成本膨胀。

很多人有个错觉:大模型价格一直在降,AI不是越来越便宜吗?实际上,这只说对了一半——便宜的永远是通用轻量模型,而企业真正刚需的编程、长上下文、复杂推理等高价值场景,价格非但没降,反而在逆势上涨。

Anthropic推出的安全增强版模型Fable 5,定价达到每百万Token输入10美元、输出50美元,是同期Opus系列的两倍。

国内的智谱AI也是一个典型样本。据天眼查,2026年一季度,智谱伴随新模型迭代连续三次上调核心API价格,累计涨幅达83%;其面向通用场景的GLM-4.7轻量模型,输入价格仅2-4元/百万Token,输出8-16元;但对准编程与Agent场景的GLM-5.2,输入价格涨到8元,输出高达28元,两者价差最高达4倍。

此外,腾讯云在2026年3-4月经历两轮调价,混元HY 2.0 Instruct模型输入价格涨幅高达463%;MiniMax核心模型价格也有30%-50%的上调。

与此同时,模型厂商的计费模式从订阅制全面转向按量付费,厂商的收入直接和Token消耗量挂钩。这就形成了一个结构性矛盾:客户的目标是用最少的Token完成任务,而厂商的商业利益天然倾向于让客户消耗更多Token。

而从实际数据来看,近来Token消耗量的增长不是线性的,而是指数级的。

2025年底至今,AI产业最核心的变化,是从对话式AI向智能体Agent跃迁。AI不再是一问一答的线性交互,而是自主规划、循环调用、多轮纠错的复杂流程,Token消耗也随之从线性增长变成指数膨胀。

Agent虽然能力强大,但据腾讯研究院分析,它其实隐藏着几类典型的低效消耗:

一是上下文陷阱,智能体每一步操作都会重复带入历史对话、工具日志和文件内容,同一批信息被反复计费;

二是技能Skill冗余,对49个软件工程技能的基准测试显示,79.6%的技能对任务通过率没有任何提升,却最高带来451%的Token开销增长;

三是多Agent的“沟通税”,多个智能体分工协作时,会不断重复任务背景、结论和格式化套话,每一次对话都是一次重复计费;

四是长任务的“熵增”,任务链条越长越容易跑偏,而为了纠偏又要增加摘要、检查、回滚机制,进一步推高消耗。

这些损耗不是简单的加和,而是互相叠加的乘积效应。一个复杂的多Agent任务,可能有近一半的Token花在了内部协调、自我纠偏和重复读取上,真正用于生成有效内容的比例并不高。对缺乏技术能力的普通企业而言,这更是一笔看不清、算不明的糊涂账。

 

03

 

「踏空的恐惧」

如果说大模型厂商的产品和定价策略是外部的“阳谋”,那么企业内部的Token消费,则是一场自上而下的“自我掏空”。

担心踏空AI变革的浪潮,企业纷纷拼命拥抱AI。这种压力自然会传导到每个员工身上,尤其在AI替代裁员的阴影下,员工普遍把“会用AI、多用AI”当成安全感来源。

不少公司把AI代码率、工具使用时长写进了OKR,甚至上线全员可见的数据看板,倒逼每个人刷消耗。简单的邮件回复、基础代码片段、常规数据查询,明明用搜索引擎或人脑几秒就能解决,也要交给大模型跑一遍——反正预算不是自己掏,用得越多越显得“拥抱变革”。

企业这般将Token消耗量与员工绩效挂钩,默认“用了多少AI”等同于“创造了多少价值”,并愿意为此支付高额账单。

有人说,这是历史规律。历史上每一次通用技术革命,都走过相似的路径。蒸汽机刚发明时,工厂主算完账发现还不如用马匹便宜;电灯刚商用时,成本远高于煤气灯。

但不同的是,电力消耗产出的是实实在在、可衡量的工厂效益,但Token换来的“智能”,到底创造了多少价值?答案是,目前还难以量化。

据晚点LatePost报道,一位互联网大厂技术管理者坦言,自己部门20多个人,一个月消耗5万元Token,回头看却没沉淀出几个可落地的成果。这笔钱相当于10名实习生的月薪,化作无形的Token之后,连清晰的产出物都没有。

企业往往认为用AI替代人工是节省了成本。但反常识的是,大量基础场景里,用AI反而比人工更贵。

国内某人力资源服务商做过测算:用AI筛选并初评一份简历,Token加系统成本约1.2元/份,而雇佣兼职人事处理的成本仅0.8元/份。类似的情况在数据标注、基础文案撰写、简单客服问答中普遍存在。

AI还有更隐蔽的成本。有软件公司的研发负责人反馈,引入AI编程工具后,初级开发的效率看似提升了,但高级工程师的评审工作量翻倍,线上故障的返工成本增加了30%以上,算总账反而不划算,而且,人反而更累了。

这正是Token经济最核心的矛盾:Token消耗与价值创造之间,从来不是线性关系。不是消耗的Token越多,产出的价值就越大;相反,很多时候消耗的增长恰恰来自无效的循环、冗余的架构和盲目的焦虑。

 

04

 

「写在最后」

回到最初的问题,谁在推动“Token通货膨胀”?不是某一家AI厂商的恶意营销,也不是某几个员工的滥用浪费,而是在座的所有人。

从卖GPU卖存储的底层算力基础设施,到大模型架构的天然膨胀属性;从每一个怕踏空AI而焦虑的企业,直至每一位担心落伍的员工——所有人,共同推高了Token的消耗,推动了Token的贬值,也推高了那本越来越厚的AI账单。

每个人都助推了Token的通胀。而每个人又在自己的推力下被拉得踉踉跄跄。

本文来自转载青橙财经 ,观点仅代表作者本人,发现AI平台仅提供信息存储空间服务。
如若转载,请联系原作者;如有侵权,请联系编辑删除。

(0)
资讯组小编的头像资讯组小编
上一篇 1小时前
拥抱AI的体育行业,正在被AI垃圾反噬
下一篇 2026年5月18日 下午4:49



扫码关注我们,了解最新AI资讯~

相关推荐

发表回复

登录后才能评论