编者按:本文来自微信公众号 蓝洞商业(ID:value_creation),作者:赵卫卫,创业邦经授权转载。
独立上市还是被并购重组,是当下摆在大模型「六小虎」面前的选择题。
两个月前,智谱 AI 在国内正式开启 IPO 进程;近日 MiniMax 也传出考虑港股 IPO 的消息。 在大模型六小虎中,智谱 AI 和 MiniMax 是最早「出道」的,早在 2022 年,智谱就训练完成国内第一个千亿开源模型;而 Minimax 同期也上线了 AI 虚拟社交产品。
上市之外,资本催化下的 AI 创业公司可选择的另外一条路,就是被大公司并购。
就在 6 月,美国的 AI 创业公司 Scale AI 被 Meta 收购,143 亿美元买下 49% 的股权,同时创始人加入 Meta 负责 AI 业务。Scale AI 成立于 2016 年,以数据标注为主营业务,帮助大公司训练和改进模型数据,并购之后,大客户谷歌和 OpenAI 很快暂停了与 Scale AI 的合作。
而国内市场,在今年的 DeepSeek 爆火之后,昔日的「六小虎」格局早已经分崩离析。
李开复的零一万物早已退出基础模型领域的竞争,是最早被外界定义为行业掉队的一个;王小川的百川智能收缩战略,聚焦医疗行业,三位联合创始人出走,也陷入外界的质疑声之中;姜大昕的阶跃星辰是最晚进入「六小虎」格局的,估值规模靠后,今年也裁撤 C 端产品聚焦智能体;杨植麟的 Kimi 也不再激进做市场投放,聚焦基础模型和智能体产品。
可以说,「六小虎」小败局已经显现,至少两到三家已经不再同一个维度竞争,演变成了「四小强」甚至更小的格局。更重要的是,面对字节跳动、阿里和腾讯等大公司在流量和产品规模上的优势,国内大模型创业的市场空间进一步被压缩,寻找差异化竞争策略成为当下洗牌期的重要任务。
DeepSeek 让资本市场重新审视投资逻辑,用户的选择也让大模型行业淘汰加剧,被并购还是谋得上市?这是摆在大模型创业公司面前不远的路。
超越 DeepSeek 很难
不再盲目追求用户规模,改变激进的获客策略,从 To C 市场转向 To B,技术重点转向底层模型,是今年上半年大模型创业公司的重要改变。
Kimi 是改变最明显的一个,在字节豆包和腾讯混元激进的市场投放和获客下,Kimi 也难以与大厂抗衡,不得不跳出大厂的射程范围,一方面继续巩固长文本等模型的优势,一方面又开拓差异化的独有场景。
从独有的场景看,Kimi 与小红书合作,小红书账号中打造了搜索对话入口,让用户可以直接利用 Kimi 一键生成笔记;而在与《财新》的合作中,《财新》高质量的内容也成为 Kimi 回答问题生成答案的高质量来源,而《财新》也具备了对外提供 AIGC 服务的资质。
但目前,这两个独有场景的打造给 Kimi 带来的优势还有待观察,与小红书的合作更偏市场营销,而与《财新》的合作更帮助《财新》获取付费用户。
另外一方面,基础模型的底层建设依然是 Kimi 的目标,包括智能体在内的应用层机会也是重点方向。最近 Kimi 开源了参数量只有 72B 的代码模型 Kimi-Dev,在 SWE-bench Verified 上以 60.4% 的成绩取得开源 SOTA,号称编程水平比最新的 DeepSeek-R1 还强。
模型性能仍旧是决定 AI 创业公司的上限,向更强大的人工智能迈进的步伐仍在继续,对标 DeepSeek 也成为最大的吸引力。
近期 MiniMax 也开源了最新推理模型MiniMax-M1,号称挑战 DeepSeek,算力租赁成本仅 53.47 万美元;而此前智谱也发布了智谱 GLM 全栈自研大模型,包括推理模型 GLM-Z1-Air 和基座模型 GLM-4-Air0414,号称前者性能达到 DeepSeek-R1 水平,速度提升最高 8 倍,价格仅需 DeepSeek-R1 的 1/30。
超越过去的 DeepSeek不难,超越现在的 DeepSeek 很难。
今年 3 月份,DeepSeek 的 V3 模型完成小版本升级,5 月份 R1 模型又完成小版本试升级,而传说中性能惊人的 R2 深度推理模型迟迟未能发布,至今仍旧是行业最期待的一件事情,相关传闻一直没有获得官方证实,而按照 DeepSeek 的发布节奏,今年 6-7 月份大概会有一个比较大的版本更迭。
在 DeepSeek 的压力之下,AI 创业公司不得不在近期抓紧模型发布的节奏,试图用更少的算力资源训练模型,以更低的成本和更优化的算法打开技术突破的路线,所以底层的模型能力依然是当下竞争的重点。
人才争夺战不止
争夺 AI 人才,是 AI 创业公司必须面对的大公司的威胁之一。
最近 OpenAI 首席执行官山姆·奥尔特曼在采访中透露,为打造顶尖的人工智能团队,Meta 向 OpenAI 员工开出高达 1 亿美元的签约奖金,甚至还有更高的年薪待遇。此前,Meta 已经挖走了多家公司的工程师,包括谷歌 DeepMind 的主要研究员 Jack Rae。
此外,Meta 最近试图收购由 OpenAI 联合创始人伊利亚・苏茨克弗创立的人工智能初创公司 Safe Superintelligence。当苏茨克弗拒绝该收购提议后,扎克伯格转而尝试招募这家初创公司的首席执行官兼联合创始人丹尼尔・格罗斯(Daniel Gross)。
1 亿美金的签约费,让外界感受到 AI 人才争夺战的疯狂程度。
但事实上,整个 2024 年 OpenAI 初创团队分崩离析,11 位初创成员中有9人离开,并没有人直接加入 Meta,他们离开的原因是 OpenAI 自身发展方向上的内部分歧,离开的初创团队成员,纷纷自立门户或是加入谷歌等公司。
导致团队分裂的往往先是内乱,然后才是外患。去年 OpenAI 在财务压力和战略分歧上导致的人才流失,也是今年中国 AI 创业公司的前车之鉴。
根据智东西统计,今年上半年,大模型六小虎中有 12 位高管离职,除了月之暗面没有高管变动,变动最多的分别是智谱、百川智能和零一万物,而且主要都是商业化负责人,包括智谱首席运营官张帆、MiniMax 商业化合伙人兼副总裁魏伟,以及此前离职的百川智能联合创始人、商业化负责人洪涛。
而六小虎中流失的高管们,去向之一就是字节跳动等大公司。
加入字节跳动的包括智谱丁铭和零一万物的黄文灏、曹大鹏;而加入京东的则是阶跃星辰的段楠,担任探索研究院视觉与多模态实验室负责人,聚焦视觉和多模态基础模型研发;加入比亚迪的则是零一万物的聂鹏程;回归贝壳的则是零一万物联合创始人李先刚。
当然,AI 行业人才流动频繁,字节跳动等大公司的 AI 人才出走也屡见不鲜。
但更重要的,人才流动折射背后的趋势是,大模型行业正在从早期野蛮生长阶段逐步过渡到更加理性的发展阶段,商业化能力将成为企业生存发展的关键,部分公司可能面临生存压力,而互联网大公司在薪酬和云计算资源上拥有更大的优势。
最近有消息称,字节跳动创始人张一鸣目前主要办公地已从新加坡转到北京,从去年下半年开始,他每月会召集一次字节核心管理层和 AI 项目负责人的复盘和讨论会。
知情人士透露,「张一鸣一直很关注 AI 业务。目前张一鸣经常往返新加坡和北京,从去年下半年开始,他每月会参加一次 seed 核心技术团队的复盘和讨论会。」
预料之中的惨烈
从人才到战略,从产品到模型,AI 创业公司无一例外都受到互联网大公司的压力,跳出互联网大厂的射程范围,在高度同质化的市场中做出差异化的模型和产品,是 AI 创业公司唯一的解药。
AI 行业分析人士指出,包括大模型六小虎在内的 AI 创业公司在未来的竞争中,可能争取的席位只有 1-2 个,淘汰赛加剧的当下,AI 大模型基座公司很难在资源上打赢这场战争,因而拥抱不同的大厂选择站队会是未来很重要的一个趋势。
而另外一个重要的趋势就是上市,作为国内大模型赛道商业化成绩最亮眼的玩家,智谱 AI 成为率先启动 IPO 的大模型创业公司,这也为其他创业公司做出了示范,很快 MiniMax 也传出考虑港股 IPO 的消息,而智谱和 MiniMax 都获得了腾讯和阿里的投资。
无论是站队大厂被并购还是走上上市之路,背后的逻辑都很清晰,AI 大模型创业公司要构建起竞争力的领域才能融到更多市场化的钱,否则难以在当下的激烈竞争中独立生存下去。
核心在于,大模型行业对资本的需求巨大,有行业人士透露,大模型基座训练往往成本上亿元的成本,而一些多模态模型的训练时间往往要数月乃至半年之久,成本也就更高,当下的融资并不足以支撑 AI 创业公司走向通用 AGI 之路,所以商业化能力和差异化的产品成为 AI 创业公司的核心竞争力。
AI 大模型创业者们,或许也早已经预料到了这场竞逐游戏的惨烈。
2024 年,当时被问到大模型公司的终局是否是被巨头收购,杨植麟认为不一定,但是有可能有很深入的合作关系,例如 OpenAI 和微软之间,而对于巨头对多家大模型公司投资而不是只押注一家,杨植麟的判断很清晰,这是阶段问题,后面会有更多的 consolidation(资源整合),会有更少的公司。
一年之后,资源整合的阶段已经到来。智谱和 MiniMax 之后,谁会是下一个去上市的 AI 创业公司?
本文为专栏作者授权创业邦发表,版权归原作者所有。文章系作者个人观点,不代表创业邦立场,转载请联系原作者。如有任何疑问,请联系editor@cyzone.cn。