模型能力卷不过Google、快手,但这家视频生成创企却可能最先赚到钱?

关注
卷不过大厂,AI 创企如何靠“差异”突围?

编者按:本文来自微信公众号 白鲸出海(ID:baijingapp),作者:张凯然,编辑: 殷观晓,创业邦经授权转载。

去年 4 月,我们曾经观察过 AI 视频赛道,彼时赛道 Top 级玩家还是 Pika、Pixverse、Haiper 等华人创企。

图片

注 1:撰写文章时 Kling2.1 已经推出,但 Artificial Analysis 并未更新

注 2:Arena ELO 是通过让多个大语言模型互相“对战”,由人类或其他模型判断优劣,然后用类似于国际象棋 Elo 评分机制来动态评估模型强弱。

但一年之后赛道风云突变,曾经风光无限的华人创企们被 Google、快手、OpenAI 等大厂取代,虽然华人在其中仍占据重要位置,但 Pika 们面临着空前的激烈竞争。

图片

图片无论是 Web 端(上),还是 App 端(下),PixVerse 都能够占据相当不错的位置|图片来源:AI 产品榜、非凡产研

但凡事总有例外,在 AI 产品榜的榜单上,由前字节视觉技术负责人王长虎创立的 PixVerse 却异常顽强,不仅网站流量能排在赛道前五,移动端更是拥有 1915 万的 MAU、84 万美金的月流水(非凡产研数据,根据官方说法 MAU 是 1600 万),排在全球视频生成类 App 的第一位。

而根据 Pixverse 自己的说法,其全平台累计用户数已达到 6000 万,月订阅收入达到了千万人民币的水平,且收入已经可覆盖绝大部分成本。虽然可灵的收入比 PixVerse 更高,但收入高企未必“收支平衡”,PixVerse 算是首个有望赚钱的主流视频生成产品。

凭借亮眼的增长和商业化成绩,母公司爱诗科技于 2025 年 3 月完成 A 轮融资,总融资额超过 4 亿元(约合 5600 万美元,分 5 次进行)。6 月 6 日,PixVerse 国内版「拍我 AI」Web、App 端同时上线。

模型能力并非最顶尖,却取得优秀成绩,PixVerse 走的是一条怎样的路径?

Kling 向左,Pixverse 向右

与很多创企拼模型能力、瞄准专业视频创作者不同,Pixverse 能够突出重围的路径是“靠模板化的视频生成功能,服务普通用户”,这是其大用户基数的基础。从 PixVerse 和 Kling 的 App 端设计对比,可见一斑。

图片

PixVerse落地页面(左),PixVerse创作页面(右)

PixVerse 的落地页不是主页、而是第 2 个一级标签“#模板”。这个页面采用双瀑布流布局、点进去之后也可像 TikTok 一样上下划动,展示的差不多都是 5s 左右偏娱乐化的“模板特效”,底部直接放上做同款的按钮,用户点击后就会被引导到一个创作页面做同款(如右图),用户仅可以更换图片、以及调整分辨率等简单参数,但无法修改 Prompt。根据 PixVerse 创始人在对话中的说法,模板功能是现在 PixVerse 的主推功能。

图片

PixVerse 的创作界面,其中包括文生视频、图生视频、

模版、首位帧、多主体、视频续写 5 个创作功能

在视频创作的时候,用户除了模板也有其他功能可供选择,包括文生视频、图生视频、首尾帧、多主体、视频续写等等,但相比网站端,App 端能调节的参数很少,仅包括音效和分辨率,且只能生成单镜头视频。

而被做出来的视频,如果用户选择“发帖”,会被显示在第一个一级标签“发现”中,且同样会被配上做同款的按钮,再有用户二次生成的时候,允许修改 Prompt。

图片

PixVerse 发现页面(左),PixVerse 展示页面(右)

图片

Kling 落地页面(1)、Kling 中展示的视频内容(2、3)、创作界面(4)

反观 Kling 的落地页,则是功能聚合菜单+双瀑布流的 Explore 版块,与 PixVerse 几乎每个视频(包括落地页模板标签和 Explore 版块的所有内容)都配置了做同款按钮,Kling 落地页 Explore 版块展示的视频内容分为单镜头的 Video(在单独的 Explore 标签页叫 Creatives)和有分镜的复杂视频 Shorts,前者有点类似于 Pixverse“发现”标签页展示的绝大多数视频,可以 Recreate;后者由于更加复杂,在 PixVerse 中基本没有,Kling 中也仅作展示,无法 Recreate。

图片

Kling 中的特效界面

虽然 Kling 中也有类似 PixVerse 的“模版特效”功能,它们被放在了“Effects”功能中,但数量相比 PixVerse 少了很多,仅有 14 种,重要性远逊于文生视频等其他功能。

图片

Kling、Pixverse 功能总结

从可做同款但无法改 Prompt 的“模板功能”到“带分镜的复杂视频”,创作自由度和难度都是越来越高的,面向用户群体的专业度也逐步升高。从上述的观察看,PixVerse 主推的是最简单的“模板”,兼有单镜头视频;而 Kling 在 App 端,将类模板功能的重要性放到最低(从展示数量和位置)。总体看,Kling 给予用户的创作自由度更大,锚定更有创作意愿的用户;PixVerse 更“傻瓜”,面向更轻更泛的人群。

如果结合 Web 端来观察两款产品,Kling 的 Web 端与 App 端差异并不大,尤其运动笔刷等进阶功能,Kling 也将其加入到了 App 中。PixVerse 的网页端会与 Kling 更相似一些,而在 App 中做了不少“减法”,仅推出了一些较为基础的功能。从这个角度也可以看出,PixVerse 是在做主动找“下沉”用户的动作。

转型是因为真卷不过

AI 视频赛道兴起的时间点是 2023 年中,先行者是 runway,由于 runway 团队的“基因”更偏向专业艺术创作,所以他们的目标一开始就定在了服务电影等专业视频创作场景,早期跟随 runway 杀入市场的产品们,也都走的这条路径。

王长虎出身字节,去年初曾表示,“面向 C 端、赋能短视频创作”会是AI视频赛道更大的机会,但彼时的 PixVerse 还看不出向 C 端倾斜的迹象。

图片

2024 年 8 月 9 日,白鲸出海在《这一次,“大力出奇迹”的是快手选题》中对 Kling 、Vidu、PixVerse V2 的测试结果,注:PixVerse V2 于 2024 年 7 月 24 日发布,比 Kling 晚了不到 1 个月

PixVerse 的转变要等到 2024 年 10 月 V3 版本上线时,转变的直接原因大概是“卷不过了”。2024 年 8 月,在视频生成爆发的时间点上,白鲸曾经对 Kling 1.0、Vidu 与 PixVerse V2 做了一个对比测试,当时的结论是“PixVerse V2”已经落后了。

而“落后”的原因,可能是“资源有限”。爱诗科技联合创始人谢旭璋在近期的一档播客中表示:爱诗科技作为一个 Base 国内的创企,能够调动的财力、资源远不如大厂或位于美国的创企,所以 PixVerse 从一开始就定下了“不过度花钱训练模型,着重优化训练效率” 的方针。

按他的说法,PixVerse 的模型训练成本仅有可灵等同行的 1/10,甚至 1/20,虽然靠工程优化可以一定程度上提高训练效率,达成“以小搏大”的效果,但数倍的预算差距仍造成了 PixVerse 模型能力的落后。再叠加上后续可灵的一炮而红,让快手押注了更多资源去迭代,PixVerse 想在模型能力上追上 Kling,难度很大。

图片

PixVerse web 端近一年流量变化趋势|图片来源:AI Pure

彼时的 PixVerse,网站流量虽然有增长,但仅停留在“小几百万”的量级,与 Kling 等产品的差距甚大。

所以,2024 年 10 月推出 V3 版本时,PixVerse 推出“模板”功能,开始转向 C 端,网站流量也出现了第一波“窜升”。所谓“模板”算是“图生视频”,先由 PixVerse 预先微调好“模板”,用户上传图片/视频来提供“视频主体”,然后模型再基于“模板”对视频主体进行一系列变化,为用户交付一个相对酷炫的短视频。

这种模式的好处是,首先用户不需要撰写难度颇高的 Prompt,门槛低于“文生视频“,其次“模板”是经过 PixVerse 团队微调过的,且视频时长较短、场景单一,生成视频的稳定度高,几乎不用抽卡。

虽然模型能力的劣势客观存在,但“模板特效”可以靠前期“微调”,一定程度上规避模型的不稳定性,而且 C 端用户对细节的要求并不那么高,“酷炫、且不明显失真”就已经足够了。

C 端用户对娱乐产品,与小 B 用户对创作工具的要求是不同的,小 B 用户由于更偏刚需场景,对质量的要求高,但对速度不是那么敏感,而 C 端用户则相反,对质量略宽容,对速度要求高,如果等待时间过长,他们就会失去耐心,离开 App。PixVerse 在 V3 版本及后续迭代中对此进行了着重优化,目前,PixVerse 最短仅需 5 秒就能生成一段 360p 的模板视频,从笔者自己的体验看,PixVerse 的生成速度在主流模型中是比较快的。

图片

2024 年 11 月 TikTok 中的毒液变装视频|图片来源:数字生命卡兹克

从服务专业创作者,转向服务普通用户,为 PixVerse 带来了新的增长机会。2024 年 10 月下旬,漫威电影《毒液:最后一舞》上映,借着这个热度,PixVerse 上线“真人变毒液”的特效模板,在社媒上开始“病毒式传播”,时至今日全网播放量超 10 亿。PixVerse 的网站访问量也在当月大涨 80%。

图片

2024 年 11 月 PixVerse 流量大涨 80%|图片来源:AI 产品榜

自此,靠模板特效,吸引 C 端用户,专注短视频,就成了 PixVerse 的核心“卖点”。

图片

PixVerse 和 Kling 两大关键词近一年的搜索热度,PixVerse 产生爆款时搜索热度就会有一个峰值|图片来源:Google Trends

PixVerse App 端紧接着在 12 月上线,“耶稣温暖你”、“拥抱老虎”、“咧嘴大笑”等特效视频,在社媒上此起彼伏地火了起来,美国、巴西、印尼等大市场的下载总榜上,PixVerse 的身影频繁出现,期间,PixVerse App 端的 MAU 也能保持持续且快速的增长。

图片

点点数据给出的 MAU 与创始人的分享有一定差距,这里仅用作趋势观察|图片来源:点点数据

护城河在哪里?

图片

MAU 靠前的娱乐向AI视频生成 App

全球双端数据| 数据来源:点点数据

“服务专业创作者难度大,转向 C 端,服务对生成质量要求较低的普通用户”并不是很难想到的转型思路,市面上也不乏类似产品出现,远一些的如万兴科技的 SelfyzAI,新一点的产品如 Hula 及土耳其厂商 HubX 的 AI Video 等等。但是与 PixVerse 相比,虽然收入 App 端收入可能还没有拉开,但 MAU 已经有了质的差距。

而对 C 端娱乐向产品来说,“快”是杀手锏,每次最早能够洞察和接住热点的产品往往能吃到最大的流量红利。PixVerse 最初靠 PGC 模式生产模板,也就是由团队“脑暴”创意,然后做模型微调和技术优化,再推向市场,去年的“毒液变装”就是这个模式。

创始人表示,相比其他同类产品,PixVerse 的优势在于“反应速度快且稳定”。因为自有模型,PixVerse 团队想出一个创意或一个热点出现时,团队可以在很短的时间内完成模型端的优化和微调,相比很多调用 API 的产品,PixVerse 上线速度更快,及时地呼应热点。

图片

上线初期,PixVerse 的增长主要是靠社媒,今年 3 月以后,广告投放才跟上|图片来源:广大大

由于能够快速呼应热点,PixVerse 能够在社媒上持续获得免费流量,从广告投放的情况看,PixVerse 在今年 3 月之后才开始进行有规模的“买量”。

与剪映靠剪同款和创作者生态爆发式增长类似,在去年 12 月 PixVerse 上线 App 端后,“特效”的生产转向了“投稿”模式。也就是由团队发掘(用户提交)效果比较好的特效,然后再经过工程优化,上线到 App 和网站中,供其他用户做同款,目前 App 中的 70-80 个特效大多数是这种模式“生产”出来的。

但因为 AI 的特殊性,目前,PixVerse 上线的“模版”仍依赖开发团队,并没有直接的 UGC 内容发布链路。

在发力 toC 的同时,PixVerse 也没有放松模型能力。根据我们 2 月份的测试,PixVerseV4 已经在模型能力上追上了 Sora、Hailuo 等第一梯队模型了(详见《PixVerse 再推新模型,生成能力跻身第一梯队?》),而 2025 年 5 月 14 日上线的 V4.5 版本,PixVerse 还增补了电影镜头控制、多图像参考,以及对复杂动作的增强处理等面向专业用户的进阶功能。

写在最后

依靠自有模型,加上团队对热点的捕捉和工程化努力,Pixverse 在卷不过的时候快速转型 toC,在移动端拿下千万 MAU。快,是关键。

而如何能一直保持最快,是 Pixverse 必须回答的难题。

图片

注入选产品标准:1、以生视频为核心功能(HeyGen 等数字人产品、Luma 等 3D 建模产品等,不包含在内)2、App 端、Web 端都有产品,3、有自研模型|白鲸出海制作

在视频领域,其实也不乏大模型卷不过,开始转特效的的玩家,在大厂倾斜资源卷能力的时候,转向 C 端快速获得收入,可能才是创企们更务实的生存之道。

参考文献:

1、AI视频产品怎么Go Viral?6000万用户的PixVerse的答案

2、对话 PixVerse 王长虎:AI 视频生成可能通向新平台,Sora 只领先几个月

3、爱诗王长虎、谢旭璋:“不会创业” 的创始人,怎么做出用户量第一的 AI 视频产品

4、这一次,“大力出奇迹”的是快手

5、PixVerse再推新模型,生成能力跻身第一梯队?

数据来自SimilarWeb、点点数据、Semrush、广大大等三方平台,可能与真实数据中存在一定误差,仅供参考。

本文为专栏作者授权创业邦发表,版权归原作者所有。文章系作者个人观点,不代表创业邦立场,转载请联系原作者。如有任何疑问,请联系editor@cyzone.cn。

反馈
联系我们
推荐订阅