火山引擎想做Token“熔炉”

关注

大模型爆发后,逐渐形成了几个AI重地,北京、上海和杭州。经常穿梭这几个城市之间的人,都有一个直观的感受:机场如战场,大屏轮番轰炸,撕开了看似平静的伪装。

云厂商是绝对的主角。北京首都机场出发大厅,阿里云挂出了“通义千问”模型的横幅,正对面打擂台的是百度云,主题是智能体和超级应用。再走几百米,不远处赫然立着的是火山引擎的广告牌,“火山引擎,你的AI云”。

作为后起之秀,火山引擎把“野心”刻在了基因里,2021年便制定了千亿营收的目标。在缺乏先手优势的情况下,火山引擎前期增长较缓慢,直到遇到了大模型的机会。

同样的情况也发生在百度云身上,国内首发大模型,先一步拿到了AI的船票。

据划重点报道,火山引擎2024年营收规模超120亿,2025年营收目标超250亿元。若数据属实,200亿这个数字将成为关键。财报显示,百度云2024年营收为218亿元,这意味着云计算的洗牌时刻正在进行时。

不过,单纯谈营收数字没有太大意义。比起阿里云这种“老前辈”,百度云和火山引擎仍处于高速增长和扩张时期,首要目标是把自己云收入的盘子做大。

据多位行业人士反馈,火山引擎目前是表现最激进、不计较投入的云厂商。

外界最直观的感受可能是豆包App,前期靠投流成为AI应用界“顶流”。即使遭遇DeepSeek突袭,豆包仍在继续投入。

一份内部调研纪要数据显示,其日均DAU1600万,MAU在7000-8000万,次日留存30%,七日留存23%。每天对话轮次在7-8轮,Token消耗量2500-3000。今年豆包App端的目标为,DAU破5000万。

此外,高薪挖人、搞价格战、扩列朋友圈等动作,再次体现出字节“大力出奇迹”的业务精神。

在今天,只谈OKR,不讲ROI的火山引擎,能否凭借新叙事模式坐稳“第四朵云”的交椅?

Token化

“发布会上吹的牛,大概就是他们的KPI。”

穿梭在云厂商之间的创业者们调侃,“各家的发布会像是文字游戏,只讲对自己有利的部分”。我们也注意到,各厂商所出具的模型评分指标和体系存在出入,唯一统一的参考对象是DeepSeek-R1,甚至出现了只有图没有数字的情况。

阿里云讲模型影响力,看开源下载量、引用量,火山引擎更加简单粗暴,统一看Token调用量。

有接近火山引擎人士向我们表示,火山引擎正在自上而下推动“Token”文化,“谭待(火山引擎总裁)的逻辑很简单,销售身上都背上指标,今年卖多少产品,卖的这些产品能消耗多少数量的Token”。

此外,火山引擎对内的大模型转化,也一律以Token调用量级来衡量。“他们内部疯狂地推豆包、扣子等产品,要求每个人都要用,创建自己的智能体”。

截至目前,火山引擎公布了两组数据:包含内部产品下,豆包大模型日均Token处理量达16.4万亿。据IDC统计,在不包含内部产品条件下,去年国内大模型调用总量中,火山引擎占比46.4%,相当于百度与阿里之和。

与之形成对比的是另一组数据,2024下半年,中国公有云服务整体市场规模(IaaS/PaaS/SaaS)为241.1亿美元。公有云IaaS厂商市场份额,阿里以30.2%占比,位居第一;PaaS厂商市场份额,阿里以24.4%占比位居第二名,字节火山引擎则榜上无名。

火山引擎在市场竞争中处于下风,一方面说明头部厂商长期垄断,通过早期布局和生态整合已经建立了较高的壁垒。另一方面也证明,火山引擎IaaS-PaaS协同效应不够,PaaS层倒流效果较弱,同时IaaS层尚未形成规模效应。

这也是为什么火山引擎要绕过传统IaaS/PaaS/SaaS分层模式,转而把资源押注在新兴的MaaS行业和Agent。MaaS直接与模型调用量挂钩,这也解释了其全面Token化的原因。对于阿里云老牌玩家来说,仍在利用基建层规模化优势,坚持消耗云计算资源路线。

有一部分AI应用产品开发者认为,在大模型时代,传统的DAU、MAU等产品指标已经过时,应该用消耗的Token量来衡量一款AI产品。在一些企业内部,也把消耗Token量视为考察智能化进度的其中一项。

值得注意的是,Token消耗量大不绝对等于赚钱,甚至免费额度部分也被计入到总消费量中。我们观察发现,企业级用户对火山引擎的“低价策略”有一定认知。一些客户能灵活地运用“免费”策略,不断地在各个模型间切换。

Token消耗能展现中间态,但不能表明结果。在大模型智能成本越来越低的背景下,企业要么选择开源模型自主构建,要么对价格已经脱敏。比起看Token调用和价格,他们更想要的是解决问题。

大力出奇迹?

为了拉动Token消耗量,火山引擎采用了“饱和”营销的攻势。

要超越,从模仿开始,模仿的第一步是挖人。近些年,云计算市场上演了“冰与火之歌”,一边是接连不断的人员优化,一边是不断吸纳新人。

官方招聘网站显示,火山引擎在招岗位将近有六百多个。近些年来,火山引擎吸纳大量原阿里云人员,有人粗略估计目前其人数占比约在30%-40%。

大模型人才竞争同样激烈,知情人透露,字节不仅花高价挖来了原通义千问技术负责人周畅及其团队,还把阿里语音研究方向的人员“基本挖空”。于同在竞争桌上的阿里云而言,无异于一记重击。

综合多个渠道消息,字节目前是AI人才储备最充沛的大厂,吸收了竞对大厂、AI明星创业公司等不同背景人士。arxiv显示,2025年一篇关于利用强化学习提升推理模型性能的论文中,Seed团队署名作者人数高达270多人。

4月份的一份内部调研纪要显示,Seed模型团队主带队人是吴永辉,原谷歌DeepMind副总裁和Gemini核心贡献者,带队人数约1200人。团队人员构成上,30%-40%为原有团队转型而来,40%是集中扩容的新增社招和校招,20%是从外部挖来的大牛。

凭借“钞能力”,字节和火山引擎内部上演了“神仙打架”的戏码,但能否实现一加一大于二的效果尚未可知。近期或许已经初露征兆,吴永辉加入后,字节大模型团队开始频繁传出离职和岗位变动消息,而这可能会影响到字节大模型未来的发展走向。

按照字节Seed团队已发布的论文来看,之前的研究方向集中在大模型、多模态、视觉生成、音频和推荐系统等方向。在此基础上,豆包大模型团队正在朝着“多模态世界模型”方向继续进行。

字节官网招聘页介绍里,有两项值得关注的点:探索突破包括而不限于多模态RAG,视觉CoT与Agent等在内的多模态模型、世界模型进阶能力,构建GUI/游戏等虚拟世界的通用多模态Agent;利用预训练、仿真等技术对虚拟/现实世界的各类环境进行建模,提供多模态交互探索的基本能力,推动应用落地。这说明字节大模型研究,不仅服务B端云业务,也将用于创建新的C端产品。

同时,我们发现近期字节正在组建名为“BandAI”新团队。据介绍,该团队主要探索大模型、多模态、Agent等智能技术在交易场景的可能性,涉及抖音电商、生活服务、广告等场景。如此看来,改造旧业务,降本增效依然是大厂的关键课题。

寞落的豆包

谭待经常开玩笑说,“企业AI转型第一步,就是董事长先下载一个豆包App”。

豆包被字节内部人称之为“明星项目”,主要的业务分为PC端和移动端。在拉新增长的目标驱动下,豆包应用团队长期处于扩张状态。截至目前,豆包应用的研发团队近百人,总团队人数在一百余人。

得益于字节系流量扶持,豆包应用前期增长非常迅速,成为了2024年用户量最大的AI应用,直到DeepSeek的出现。DeepSeek的迅速破圈,一度让字节陷入了沉思,包括豆包应用团队的一些人。有人告诉我们,“在DeepSeek大火前,大家对于AI团队人数规模没有明确标准,而在差不多规模下,DeepSeek研发出了R1,顺便上线了一款应用”。

豆包应用团队的人员配置在大厂是常态,可跟DeepSeek一比,似乎略显“冗余”。

作为火山引擎的“门面”,豆包正在逐渐向一款独立应用靠拢。一位曾在豆包任职的研发人员表示,日常功能迭代过程中,豆包团队一般不会跟模型层打交道。即便模型层升级,应用层也不会有太大感知,他们只会在内部基于用户反馈和需求上线新功能。

一个细节是,豆包内部人士多次否认存在竞品,但毫不吝啬对DeepSeek的夸奖。

DeepSeek式反思过后,字节声称弱化投流,专注探索智能无上限。但光子星球了解到,豆包应用的移动端和PC端均有与DAU相关的KPI,并且一个季度一总结、一制定,“Q2仍有一些指标尚未完成”。

有AI产品经理告诉我们,AI应用现在看DAU有一定参考性,但更重要的是要评估用户的有效对话轮次。如果只是用户进来提问,没有多大意义,只有他们完成了有效问答,才能对产品迭代产生意义。

相比去年,豆包的营销投放虽然放缓,却还在继续。内部调研纪要估算,豆包一个月投放预算约在6000-7000万,40%投放在内部渠道,60%投放在外部渠道。

至此,人才、模型和应用均已到位,字节“大力出奇迹”的故事,能否在火山引擎身上实现?


反馈
联系我们
推荐订阅