互联网养虾人尝到的甜头和苦头

小鹿向新莓回忆起不久前的一场AI小事故,仍然心有余悸。

小鹿在北京一家媒体负责运营,一个人管理着三个账号。她对没有用上AI智能体之前的生活有一个精准的形容,「每一项工作都不难,但加在一起就是搞死人。」刷信息流找热点、汇总写文案、配图发布、回复评论……每天循环往复,停不下来。

「龙虾」的出现,一定程度上让她从这种琐碎和重复中解放出来,但同时也给她带来灾难。

前段时间,小鹿养的「虾」追了一个敏感热点,自动发出去了,结果触发「无形的手」干预,当天不仅帖子被删,账号也被限流三天。

小鹿不是个例。养一只「虾」,正在成为越来越多打工人的常态,因此也产生新的日常开销,甚至新的风险和成本。

国盛证券研报数据显示,中国整体日均Token消耗在2024年初仅为1000亿,到2026年3月已突破140万亿,两年多时间增长了超过1000倍。

而根据IDC预测,中国活跃智能体数量将在2031年突破3.5亿,年复合增长率高达135%以上,伴随任务密度与复杂度提升,智能体Token消耗将迎来年均超30倍的指数级跃升。

Token,也正成为继流量之后,又一项悄悄进入生活成本的基础支出。

而这只横空出世的「龙虾」,究竟会成为打工人的效率杠杆,还是食之无味弃之可惜的新型吞金兽?

01

养虾的甜头和苦头

年前,旁听了一场业内关于AI应用的分享后,小鹿和同事在老板的号召下,试着搭建了一套小红书自动化链路。

给「虾」一句话指令,它自己去追热点、写文案、做封面、定时发布。「早上起来直接审稿就行,不用自己泡在信息流里了。」小鹿告诉新莓,这套流程解决了她日常工作大概七成的重复劳动,剩下的三成卡在封面上,「AI生成的图总跟文案差点意思,而且平台对AI图有限流,所以还是得自己经手再过一遍。」

「虾」是AI智能体在用户圈子里的通行叫法。

与普通AI对话产品不同,它能自主规划任务、调用外部工具、自动执行完整的工作流,不只是回答你的问题,还替你把事情做完。

2026年初,OpenClaw的出现成为这波热潮的重要引爆点。这款可在用户自有设备上运行的个人AI智能体助手一经推出即在全球广受欢迎,GitHub星标数在极短时间内飙升登顶,超越了React、Linux等历经数十年积累的开源传奇。之后国内开始出现各种「虾」同类或变种。

互联网养虾人尝到的甜头和苦头

OpenClaw的Github星标数快速飙升 来源:OpenClaw社交平台

数字足以说明这场热潮的体量,背后则是职场打工人对「养虾」无法抵挡的热情。

独立开发者陈博一个人负责维护好几个项目,有些代码因为年代久远没时间重构,但放着又心神不安,总担心不知什么时候就卡BUG了。「重构要整块时间,但整块时间永远挤不出来。」

浪潮来临,陈博养了一只专门用于解决工作问题的虾,把重构任务拆碎扔给虾,「它能读写文件、执行Shell命令、SSH到其他机器,跟我自己在终端里能干的事基本一样,我早上来看结果、审代码、做决策。」

而且他让这只虾专门在夜间工作,原因很简单,「闲时Token省钱,还不卡。」

如果说陈博养的是一只「实习程序员」,那上海的产品经理林然则给自己养了个「实习分析师」。以前,林然每个周末都要加班,花上几个小时,刷遍知乎、小红书和应用商店的评论,手动筛选出提到竞品的内容,整理成报告,以便在周一例会上向老板汇报。

现在,他让「虾」每天早上自动跑一遍,把结果总结成简报推送到飞书,他只需要做最后的审核。「之前都得靠自己收集整理,但现在自己只需要审核AI整理的结果即可。」林然坦言效率提升巨大。

同样在上海,私募研究员张恒则用「虾」来盯盘和筛选研报。他白天忙于开会和见客户,无法持续监控市场,过去完全被动地依赖微信群里的信息流。现在,每天都会有一套定制化的市场信息简报定时推送给他。

四个人,四种用法,但交给「虾」的活儿却高度一致,多为重复的、格式化的琐事。正如麦肯锡2025年全球AI调查显示,AI真正大规模渗透的场景,集中在流程清晰、标准化程度高、数据充分的领域。上述几位养虾用户,无不如此。

然而,「虾」也不是那么好「养」的。

小鹿遭遇AI事故之后,意识到「全自动发布风险太大。」她现在改成先把生成内容写入文件夹,人工审完再发,「宁可多一步,不然连主号都得搭进去。」

林然踩的坑则是「信任过头」。

有一次他让「虾」整理一份竞品功能对比,输出的内容看起来条理清晰、论据充分,但有两个核心功能点竟是AI「幻觉」出来的,竞品根本没有。「我直接把报告发给了老板,好在我发现纰漏时老板还没认真看报告,不然得当场社死了。」从那以后,他给自己立下铁律,所有对外报告,涉及具体功能、数据和引用,必须人工进行二次核对。

张恒虽然自己还没踩过坑,但一个发生在同事身上的案例,让他当即就去重新检查了自己的所有配置。

他的同事当时给「虾」的指令是「检查收件箱,给出存档或删除的建议,但在我批准前不要执行任何操作」,但因为邮箱信息量过大,触发了AI的上下文压缩机制,「虾」把那句关键的「未经批准不得操作」忘掉了,开始无差别地删除邮件。

听闻此事后,张恒至今仍然后怕。他第一时间把自己的配置翻了一遍。所有删除、发送、修改类操作的权限全部关掉,虾只能读取和整理,不能主动执行写操作。

在这些「调教」过程中,其实都指向一个所有养虾人必须接受的现实,即养虾的前期成本,远不止金钱。

02

养虾之前,先算账

先从一个最简单的动作说起,一句「你好」大约消耗1.2个Token,开支不到1厘钱。

这个数字看起来微不足道,但当「虾」开始自主执行一个囊括读取文件、搜索信息、分析结果、生成报告的多步骤任务,便可轻松消耗数万乃至数十万Token。财新曾报道,一只「勤奋的虾」,每天的Token开销可以轻松达到数百元。

陈博掰着手指算过自己的账:「月均开支稳定在两三千,高频月份冲到四千出头。模型API占大头,其次是云服务器的算力费用,硬件折旧还没算进去。」但他对这笔钱的态度很坦然:「如果请实习生,最少三千块,还得花时间带。虾不用带节约沟通成本,甚至白天黑夜都能干。」

这笔账能不能算赢,很大程度上取决于用的模型。

根据llm-stats.com的追踪数据,GPT-4级别的API推理单价从2023年初约每百万Token 30美元,三年间已降至不足1美元。但各模型之间的定价与能力差距仍然显著,其中顶级国际模型如Claude Opus 4.6、GPT-5.4,每百万Token输入约108至180元人民币;国产主流旗舰在8至15元之间;优化过的轻量级模型,则低至每百万Token 1至4元。

值得注意的是,OpenRouter显示,本月消耗量排名靠前的Qwen3.6 Plus(free)和Step 3.5 Flash (free),都依托免费或极低价格驱动了大量调用,说明性价比已成为决定流量分布的核心变量。

资深开发者和AI从业者花叔在《OpenClaw橙皮书:从入门到精通》中也提及如何「成本控制」,「从Claude Sonnet切换到『Sonnet→Haiku→DeepSeek』三级Fallback链,可以降低80%—95%的API成本。大部分简单任务(问候、查天气、简单查询)会自动走最便宜的模型,只有复杂任务才会用到主力模型。」

互联网养虾人尝到的甜头和苦头

来源:《OpenClaw橙皮书:从入门到精通》

换言之,对于Token高消耗使用者来说,「分层使用」势在必行。

陈博最初全程使用Claude Sonnet,两个月后一算账,发现近一半的简单任务用更便宜的DeepSeek就足够了,开始分层之后账单立减一半。

他给任务定了明确的触发规则,日常的代码注释、文件整理、日志分析,用DeepSeek V3.2,够快够便宜;需要多步推理的代码review,用Claude Sonnet,在工具调用和指令遵循上更稳,一次跑对比反复返工要值钱得多;遇到系统架构设计才切Claude Opus,答错了代价很高,费用会剧增。

张恒则按文档长度分模型使用,像短任务处理就用DeepSeek,整份研报处理则用Kimi,「200K上下文是Kimi的核心优势,一份研报塞进去不用分段」。而需要复杂推理任务时,张恒会手动切Claude Sonnet,「只订阅了Claude的pro会员,所以平时会省着用。」

但就在用户努力压低成本的同时,价格正在从另一侧悄悄上涨。

3月18日,阿里云宣布将平头哥真武810E等算力卡产品价格上涨5%至34%,文件存储CPFS同步上涨30%;百度智能云当日跟进,AI算力相关产品上调5%至30%,并行文件存储涨约30%,两家新价格均于4月18日起生效。再往前,腾讯云已大幅上调混元系列模型价格,其中混元HY2.0 Instruct模型输入价格上调了463%。

显而易见,这不是个别企业的定价调整,而是一场有结构性根源的全行业转向。

中信建投证券计算机行业首席分析师指出,Token调用量暴涨直接推高算力需求,多模态生成技术进一步加速了这一趋势。「以多模态生成为例,生成1分钟视频需消耗约10万亿Token,而国产视频模型的价格已低至0.5至10元/5秒,商业化落地加速,算力供需失衡持续加剧。」

国联民生证券在研报中更是一针见血地指出,「本次涨价标志着二十年来云服务价格只降不升的行业惯例被彻底打破。一旦云服务商在某一服务上成功提价而未引起大规模客户流失,第二次、第三次涨价就会变得更容易。」

这意味着,用户在模型侧省下来的钱正在被算力侧悄悄补收回去。而养虾的账,未来只会越来越难算。

03

龙虾淘金热,谁真正赚到了钱

这场来势汹汹的「养虾潮」,钱从哪来,又流向哪里?

目前来看,创业者、自由职业者、在大厂里用个人账户悄悄跑任务的C端用户,构成了这个市场最活跃的消费群体。

B端并非没有动静,只是节奏比C端慢一些。麦肯锡2025年全球AI调查显示,62%的企业已经在试验AI智能体,但仅23%完成规模化落地,主要阻碍集中在「难以证明商业价值」和「集成准备不足」两项。

眼下,这个僵局正在被打破。

2026年3月,阿里巴巴启动内部计划向员工提供Token额度,淘天集团「AI生产力计划」向实习生全员开放。58同城董事长姚劲波向媒体透露,公司每天消耗接近2000亿Token,「我甚至会问团队,卡什么时候能用完,下一批什么时候买。」4月1日,康师傅、名创优品、安克创新、书亦烧仙草、晨光文具等12家企业集中宣布,将为优秀员工提供「无限Token」权益。

Token消耗,正在从个人自费的私人账单,变成组织管理的一部分,那句「工资条上配发Token额度」的玩笑,也正步步走进现实。

OpenRouter平台的实时数据,一定程度上能看出这场热潮的大致流向。从本月应用消耗榜来看,上榜的几乎都是编程与Agent工具,其中OpenClaw以20.3T tokens断层领跑。

互联网养虾人尝到的甜头和苦头

Token消耗量最大的应用 来源:OpenRouter

不过,榜单反映的是「谁在被使用」,而非「谁在赚钱」。

OpenClaw本身是开源免费的框架,不向用户收取任何费用。用户每一次通过它发起任务,背后消耗的每一个Token,实际上都在调用上游的模型API。也就是说,资金真正流向了模型厂商和云基础设施提供商的账户,而非这些应用本身。

换言之,模型API厂商是最直接的受益者,也是直接卖「子弹」的人。

在这场「养虾潮」中,国产大模型「双雄」智谱和MiniMax走了两条截然不同的路,却指向同一个终点。

智谱走的是「提价」路线。2026年一季度智谱对API价格接连上调,累计涨幅达83%,相对上一代GLM-4.7价格接近翻倍;涨价之后调用量不降反升,市场依然供不应求。

MiniMax的打法则是「降本增效」。2026年2月,它推出专为Agent场景设计的M2.5模型。据《财经》引用测算,M2.5的单位Token成本只有OpenAI同类模型的四分之一,但面对中等复杂任务时可靠性与之接近。上线不到一周,M2.5便登顶OpenRouter平台Token调用榜首。

两种策略,殊途同归。中金公司研报将此描述为,行业定价逻辑正从「流量消耗」转向「算力价值变现」。

然而,消耗量在涨,利润还没跟上,却是当下大模型市场最基本的矛盾,也是这场淘金热最残酷的底色。

3月31日,智谱交出了上市后的首份财报,2025年全年营收7.24亿元,同比增长131.9%,净亏损却达47亿元。MiniMax同期经调整净亏损约2.51亿美元,与上年基本持平。

相比之下,这场「养虾潮」中的另一明确受益者云基础设施厂商,似乎处境更好一些。

除了上述提及「云服务价格只降不升的行业惯例被彻底打破」外,腾讯云的变化最具代表性。

腾讯在2025年年度财报中写道:「2025年我们保持了健康的增长,云业务收入加速增长并实现了规模化盈利。」这也意味着,从2013年腾讯云品牌正式推向市场算起,历经十二年持续投入,腾讯云终于跨越了从「烧钱换市场」到「自我造血」的关键拐点。

而推动这一拐点提前到来的核心变量,正是AI智能体爆发所带动的算力需求井喷。自主运行的Agent动辄触发数十个推理循环,对算力、存储、数据处理提出了更高需求,直接为云厂商带来了前所未有的需求侧动能。云厂商的收入结构也随之改变,从过去卖一次性资源,变成了收持续性的「算力租金」。

对大厂而言,没有一块业务是孤立存在的。云服务消费增长的背后,也是大厂积极争夺龙虾入口的必然结果。

OpenClaw爆火之后,国内大厂几乎都推出各种「龙虾」。阿里推出「悟空」,腾讯发布QClaw和WorkBuddy,字节升级「飞书aily」,华为发布盘古Agent,百度推出文心智能体……短短一个月时间,市面上的「龙虾」产品多达数十款。

这些产品本身大多并不直接收费,大厂入场的真实逻辑,是争夺上游的算力消耗入口。

中银证券研报中指出,「OpenClaw创造了全新的『模型消费场景』。一个配置合理的OpenClaw,每天可能会向模型发起数百次甚至上千次调用,并且每次调用时都携带完整的上下文信息。这意味着单个OpenClaw用户产生的Token消耗量,可能是传统聊天用户的几十倍甚至上百倍。」

更关键的是,用户一旦完成智能体部署,就不会轻易离开。因为养成习惯的工作流、积累在平台内的任务记录与数据、与云端API的深度绑定,都在悄悄抬高用户的迁移成本。

先烧出规模,再等待盈利的到来,这是所有玩家心照不宣的默契。「龙虾」时代,依然难逃如此规律。

(应访谈对象要求,文中小鹿、陈博、林然、张恒为化名。)

本文来自转载微信公众号“新莓” ,不代表发现AI立场,如若转载,请联系原作者;如有侵权,请联系编辑删除。

(0)
资讯组小编的头像资讯组小编
1.2亿观众,见证AI漫剧从狂热到崩塌
上一篇 12小时前
赛博脑白金,能治好AI的失忆症吗?
下一篇 12小时前

扫码关注我们,了解最新AI资讯~

相关推荐

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注