火山引擎想做Token“熔炉”

光子星球·2025-06-21

关注

大模型爆发后，逐渐形成了几个AI重地，北京、上海和杭州。经常穿梭这几个城市之间的人，都有一个直观的感受：机场如战场，大屏轮番轰炸，撕开了看似平静的伪装。

云厂商是绝对的主角。北京首都机场出发大厅，阿里云挂出了“通义千问”模型的横幅，正对面打擂台的是百度云，主题是智能体和超级应用。再走几百米，不远处赫然立着的是火山引擎的广告牌，“火山引擎，你的AI云”。

作为后起之秀，火山引擎把“野心”刻在了基因里，2021年便制定了千亿营收的目标。在缺乏先手优势的情况下，火山引擎前期增长较缓慢，直到遇到了大模型的机会。

同样的情况也发生在百度云身上，国内首发大模型，先一步拿到了AI的船票。

据划重点报道，火山引擎2024年营收规模超120亿，2025年营收目标超250亿元。若数据属实，200亿这个数字将成为关键。财报显示，百度云2024年营收为218亿元，这意味着云计算的洗牌时刻正在进行时。

不过，单纯谈营收数字没有太大意义。比起阿里云这种“老前辈”，百度云和火山引擎仍处于高速增长和扩张时期，首要目标是把自己云收入的盘子做大。

据多位行业人士反馈，火山引擎目前是表现最激进、不计较投入的云厂商。

外界最直观的感受可能是豆包App，前期靠投流成为AI应用界“顶流”。即使遭遇DeepSeek突袭，豆包仍在继续投入。

一份内部调研纪要数据显示，其日均DAU1600万，MAU在7000-8000万，次日留存30%，七日留存23%。每天对话轮次在7-8轮，Token消耗量2500-3000。今年豆包App端的目标为，DAU破5000万。

此外，高薪挖人、搞价格战、扩列朋友圈等动作，再次体现出字节“大力出奇迹”的业务精神。

在今天，只谈OKR，不讲ROI的火山引擎，能否凭借新叙事模式坐稳“第四朵云”的交椅？

Token化

“发布会上吹的牛，大概就是他们的KPI。”

穿梭在云厂商之间的创业者们调侃，“各家的发布会像是文字游戏，只讲对自己有利的部分”。我们也注意到，各厂商所出具的模型评分指标和体系存在出入，唯一统一的参考对象是DeepSeek-R1，甚至出现了只有图没有数字的情况。

阿里云讲模型影响力，看开源下载量、引用量，火山引擎更加简单粗暴，统一看Token调用量。

有接近火山引擎人士向我们表示，火山引擎正在自上而下推动“Token”文化，“谭待（火山引擎总裁）的逻辑很简单，销售身上都背上指标，今年卖多少产品，卖的这些产品能消耗多少数量的Token”。

此外，火山引擎对内的大模型转化，也一律以Token调用量级来衡量。“他们内部疯狂地推豆包、扣子等产品，要求每个人都要用，创建自己的智能体”。

截至目前，火山引擎公布了两组数据：包含内部产品下，豆包大模型日均Token处理量达16.4万亿。据IDC统计，在不包含内部产品条件下，去年国内大模型调用总量中，火山引擎占比46.4%，相当于百度与阿里之和。

与之形成对比的是另一组数据，2024下半年，中国公有云服务整体市场规模（IaaS/PaaS/SaaS）为241.1亿美元。公有云IaaS厂商市场份额，阿里以30.2%占比，位居第一；PaaS厂商市场份额，阿里以24.4%占比位居第二名，字节火山引擎则榜上无名。

火山引擎在市场竞争中处于下风，一方面说明头部厂商长期垄断，通过早期布局和生态整合已经建立了较高的壁垒。另一方面也证明，火山引擎IaaS-PaaS协同效应不够，PaaS层倒流效果较弱，同时IaaS层尚未形成规模效应。

这也是为什么火山引擎要绕过传统IaaS/PaaS/SaaS分层模式，转而把资源押注在新兴的MaaS行业和Agent。MaaS直接与模型调用量挂钩，这也解释了其全面Token化的原因。对于阿里云老牌玩家来说，仍在利用基建层规模化优势，坚持消耗云计算资源路线。

有一部分AI应用产品开发者认为，在大模型时代，传统的DAU、MAU等产品指标已经过时，应该用消耗的Token量来衡量一款AI产品。在一些企业内部，也把消耗Token量视为考察智能化进度的其中一项。

值得注意的是，Token消耗量大不绝对等于赚钱，甚至免费额度部分也被计入到总消费量中。我们观察发现，企业级用户对火山引擎的“低价策略”有一定认知。一些客户能灵活地运用“免费”策略，不断地在各个模型间切换。

Token消耗能展现中间态，但不能表明结果。在大模型智能成本越来越低的背景下，企业要么选择开源模型自主构建，要么对价格已经脱敏。比起看Token调用和价格，他们更想要的是解决问题。

大力出奇迹？

为了拉动Token消耗量，火山引擎采用了“饱和”营销的攻势。

要超越，从模仿开始，模仿的第一步是挖人。近些年，云计算市场上演了“冰与火之歌”，一边是接连不断的人员优化，一边是不断吸纳新人。

官方招聘网站显示，火山引擎在招岗位将近有六百多个。近些年来，火山引擎吸纳大量原阿里云人员，有人粗略估计目前其人数占比约在30%-40%。

大模型人才竞争同样激烈，知情人透露，字节不仅花高价挖来了原通义千问技术负责人周畅及其团队，还把阿里语音研究方向的人员“基本挖空”。于同在竞争桌上的阿里云而言，无异于一记重击。

综合多个渠道消息，字节目前是AI人才储备最充沛的大厂，吸收了竞对大厂、AI明星创业公司等不同背景人士。arxiv显示，2025年一篇关于利用强化学习提升推理模型性能的论文中，Seed团队署名作者人数高达270多人。

4月份的一份内部调研纪要显示，Seed模型团队主带队人是吴永辉，原谷歌DeepMind副总裁和Gemini核心贡献者，带队人数约1200人。团队人员构成上，30%-40%为原有团队转型而来，40%是集中扩容的新增社招和校招，20%是从外部挖来的大牛。

凭借“钞能力”，字节和火山引擎内部上演了“神仙打架”的戏码，但能否实现一加一大于二的效果尚未可知。近期或许已经初露征兆，吴永辉加入后，字节大模型团队开始频繁传出离职和岗位变动消息，而这可能会影响到字节大模型未来的发展走向。

按照字节Seed团队已发布的论文来看，之前的研究方向集中在大模型、多模态、视觉生成、音频和推荐系统等方向。在此基础上，豆包大模型团队正在朝着“多模态世界模型”方向继续进行。

字节官网招聘页介绍里，有两项值得关注的点：探索突破包括而不限于多模态RAG，视觉CoT与Agent等在内的多模态模型、世界模型进阶能力，构建GUI/游戏等虚拟世界的通用多模态Agent；利用预训练、仿真等技术对虚拟/现实世界的各类环境进行建模，提供多模态交互探索的基本能力，推动应用落地。这说明字节大模型研究，不仅服务B端云业务，也将用于创建新的C端产品。

同时，我们发现近期字节正在组建名为“BandAI”新团队。据介绍，该团队主要探索大模型、多模态、Agent等智能技术在交易场景的可能性，涉及抖音电商、生活服务、广告等场景。如此看来，改造旧业务，降本增效依然是大厂的关键课题。

寞落的豆包

谭待经常开玩笑说，“企业AI转型第一步，就是董事长先下载一个豆包App”。

豆包被字节内部人称之为“明星项目”，主要的业务分为PC端和移动端。在拉新增长的目标驱动下，豆包应用团队长期处于扩张状态。截至目前，豆包应用的研发团队近百人，总团队人数在一百余人。

得益于字节系流量扶持，豆包应用前期增长非常迅速，成为了2024年用户量最大的AI应用，直到DeepSeek的出现。DeepSeek的迅速破圈，一度让字节陷入了沉思，包括豆包应用团队的一些人。有人告诉我们，“在DeepSeek大火前，大家对于AI团队人数规模没有明确标准，而在差不多规模下，DeepSeek研发出了R1，顺便上线了一款应用”。

豆包应用团队的人员配置在大厂是常态，可跟DeepSeek一比，似乎略显“冗余”。

作为火山引擎的“门面”，豆包正在逐渐向一款独立应用靠拢。一位曾在豆包任职的研发人员表示，日常功能迭代过程中，豆包团队一般不会跟模型层打交道。即便模型层升级，应用层也不会有太大感知，他们只会在内部基于用户反馈和需求上线新功能。

一个细节是，豆包内部人士多次否认存在竞品，但毫不吝啬对DeepSeek的夸奖。

DeepSeek式反思过后，字节声称弱化投流，专注探索智能无上限。但光子星球了解到，豆包应用的移动端和PC端均有与DAU相关的KPI，并且一个季度一总结、一制定，“Q2仍有一些指标尚未完成”。

有AI产品经理告诉我们，AI应用现在看DAU有一定参考性，但更重要的是要评估用户的有效对话轮次。如果只是用户进来提问，没有多大意义，只有他们完成了有效问答，才能对产品迭代产生意义。

相比去年，豆包的营销投放虽然放缓，却还在继续。内部调研纪要估算，豆包一个月投放预算约在6000-7000万，40%投放在内部渠道，60%投放在外部渠道。

至此，人才、模型和应用均已到位，字节“大力出奇迹”的故事，能否在火山引擎身上实现？