编者按:本文来自微信公众号 白鲸出海(ID:baijingapp),作者:殷观晓,编辑:智婷,创业邦经授权转载。
在过去近一年对全球 AI 图片赛道进行数据追踪后,会有一个比较清晰的感知是 AI 商品图的头部产品在 web 端访问量屡创新高,App 端每个月流水虽然不太稳定、但也在千万人民币之上,我们就预告了 AI 商品图的选题。没想到第一个加作者卡片的读者,就是一个在 AI 圈比较知名的创业者,上来直言,“这不是一个好赛道,太卷了”。而与这类产品从业者交流时,我们也差不多得到了同样的反馈。
不得不说,卷,确实符合我们对这个赛道的一贯观察。在玩家层面,因为锚定的是巨大的电商市场的作图痛点,在早期验证了 PMF 之后(Photoroom),被越来越多的创企和大厂看上,近一年,稿定科技、快手、阿里等先后入局。在流量层面,赛道头部产品的数据屡创新高,而中尾部产品/后入局者则数据惨淡,包括大厂在内,也难以起量。
但市场上同时也释放着另一层信号。随着技术不断创新,像是 Photoroom 这样原本主攻商品图(图片中没有“人”)的产品,开始做 Virtual model 这样生成模特图(图片中有人穿着或者佩戴产品)的功能。另外还有不少创企基于 Kontext(黑森林最新模型,可多轮编辑保证一致性)开始推出与商品图和模特图相关的产品。
AI 电商图片赛道,成了一座“围城”。
一、卷起来,难以进入的后来者
先以我们持续追踪的 4 款 AI 商品图产品的 web 端数据来观察分析。上图是过去 12 个月(2024 年 7 月- 2025 年 6 月)4 款产品的月访问数据,很容易得出赛道呈现两极分化走势的结论。
数据来源:非凡产研&点点数据/Sensor Tower/Product Hunt以及结合网页历史页面快照判断,仅供参考
从上线时间来看,海外创企是移动端 App 先行,后因为业务需要拓展到 web 端,而国内创企则是 web 端先行,符合 AI 这一波先做网页的典型特征。其中网旭科技的 PicWish web 端入局最早,但却在近一年一头扎入下降通道,稿定科技 insMind 入局最晚,曾凭借“吉卜力热潮”站上 1000w+ 访问量水平线,但因为流量与产品本身定位不符,终究犹如黄粱一梦。
如今的局面看来,AI 商品图的新增流量基本被头部 2 个产品“截流”,中部产品只能固守、甚至守不住自己的流量,更遑论市场上还有一堆每月几万到几十万访问量的尾部产品。
究其原因,电商图片,属于垂类领域(相对于所有泛化的 AI 图片编辑与生成)。在垂类场景下,一、数据的累积作为行业 know-how 反馈到技术和产品的改进中,会赋予头部产品更强的动能,最终体现为更强的产品力,2 个头部产品的功能迭代也都更快一些。二、在形成较强的用户心智之后,对流量形成了一定的垄断(更多 指web 端,头部产品直接访问和自然搜索流量的同比增幅都在 20-30% 之间,并且 2 个头部产品的付费搜索和展示广告相较于之前,也都有了更大的预算投入| 数据来自SimilarWeb)。
以 Photoroom 为例,它最早在移动端验证了为电商卖家作图的需求,并基于使用数据不断训练和优化自己的图像分割模型;随后上线web端,稳稳占住「去除背景」这一关键词的流量,拓展 AI 背景(踩坑,参阅之前选题《AIGC风潮下修图App 出路在哪?PhotoRoom 示范如何月流水大涨破千万》)、AI 阴影等相关功能;在 GPT-image-1 出来后,又最快与 OpenAI 联合研发、迅速上线 AI 模特图、产品美化器、场景设计图等功能;近期又开始布局“批量生成适配不同平台素材”的功能。
而 Pixelcut 作为更晚入局、却在近一年时间斩获最多新增流量的产品(web 端新增流量 1000w+,差不多是 Photoroom 新增访问量的 2 倍),则完全奉行了差异化原则,让其在用户获取上更有发挥空间。
AI 做商品图,大概遵循上传产品实拍图-->去背景-->加背景、阴影等-->导出高清图片(甚至有的用户要求能达到打印标准)的路径,因而大部分有做商品图需求的用户去搜索的关键词,首先就是 #去除背景、然后这条路径上还能产出的关键词包括 #图片变清晰、以及 # AI 背景(因为技术限制落地水平、流量最弱)。
Top关键词、及关键词的平均点击量、以及主要流量的网站 | 图片来源:白鲸出海根据SimilarWeb数据绘制
这 3 个功能点的相关关键词、其对应的规模,以及 2 个头部产品在其中的占位,能够很好地反应出 pixelcut 为什么能后来居上。
虽然 #去除背景关键词流量规模最大(Top10 关键词有 7 个为去除背景及其各种变体)、且 Photoroom 其实占到了绝大部分流量(参见下图),但 Pixelcut 依然能在这种围困中,拿到最大流量关键词 #background remover 的 Top3 流向网站,而 Photoroom 并不在其中。在流量稍次一级的 #图片增强的关键词中,Pixelcut 更是能稳定获取相关流量。
为同类网站带来最多点击量的Top10关键词,有7个与背景相关,3个与图片变清晰相关,对应使用流程的2个非AI生成环节 | 图片来源:Similarweb这背后是 Pixelcut 针对 Photoroom 产品的 2 点差异化努力。
(1)、在 #background remover 这一关键词上,Pxielcut 的承接页面的设计,使其相较于Photoroom 额外出现在了相关问题、和图片搜索的结果页面中;页面细节之外,Pixelcut 在去掉背景的体验上做了更多优化。
2 个产品提供的去除背景的体验流程都很流畅,也都能无限制导出非高清图片。但相较于以去除背景见长的 Photoroom,Pixelcut 提供了更优质的体验。除了背景去除+纯色背景之外,Pixelcut 在加背景这一环节还另外提供了 #图片背景、#生成背景 2 个选项。图片背景可以在不登录状态下尝试,而生成背景则要登陆(以弹窗形式登陆),无需离开承接页面。登录后,生成页面也是按类别提供了非常多的选项,例如下图中,笔者上传T恤,产品提供了极简工作室和流行的街头风格等多种 AI 背景选项。而当我上传耳机,它又会根据品类推送极简科技工作室、木质桌面等 AI 背景选项。
2 款产品主要用于接 #background remover关键词流量的子功能页面 | Photoroom(上)& Pixelcut(下)
笔者测试的过程中, 会尝试更多不同背景,很容易就拉长了停留时长;而图片处理结果虽然有瑕疵、但整体效果还可以,基本能满足用户的基础需求,而无需再跳出寻找其他替代产品。这样的 SEO 操作,毫无疑问有利于优化 Google 搜索引擎排序算法中 #用户停留时长和 #last click 这 2 个核心指标。(注:谷歌排序算法中,有 2 个关键维度,#用户停留时长、#Last Click,第 2 个不好理解,其实是评估当前页面是否能满足用户完整的搜索意图,而不再去查看其他搜索结果。)
2款产品都可导出非高清图片 | Photoroom(左)& pixelcut(右)
(2)、而在图片增强的关键词上,Pixelcut 也主要打在了 Photoroom 的软肋上。
为同类网站带来最多点击量的Top10关键词,有7个与背景相关,3个与图片变清晰相关,对应使用流程的2个非AI生成环节 | 图片来源:Similarweb
图片增强,除了是 AI 做商品图流程中的一个关键节点,也真的是 Photoroom 的弱点。首先,我们在 web 端并没有找到相关功能。而在 App 端,虽然放大增强被作为 Pro 会员功能被列示在编辑工具中,但最终生产的图片清晰度,是不少用户的吐槽点。(我们对 Photoroom 近一年移动应用商店的评论做了分析,我们用#resolution、#image quality、#low quality、#low res、#blur 等 5 个词做搜索,得到多条与分辨率相关的差评)
SimilarWeb 显示,在与 Pixelcut 的关键词竞争中,Photoroom 失败的关键词主要集中在#图片增强和一些例如删掉图片文字的长尾词上。而在流量获取之外,Pixelcut 相对 Photoroom 也呈现出更开放式的设计(集成各家模型供用户选择vs.Photoroom 的“模型隐藏”)、更便宜的价格等差异点,并在用户心智上,放大 Photoroom 踩坑的 AI 背景,Reddit 上多名用户对 pixelcut 的认知是,图片背景的模板更多样、AI 背景更厉害(2025 年 7 月份 Photoroom 才把之前踩坑的 AI 背景功能做了大升级)。
在分析了 pixelcut 网页和 SEO 策略后,我们认为其之所以能在竞争的激烈中快速增长,主要原因有以下几点:
1、使用流程上可提取的关键词(例如去除背景、高清图片)流量规模最大,但占住该关键词有窗口期;面对对手多个页面围追堵截,可以选择火力主攻 1 个页面,提高其搜索权重以获得流量。
Photoroom 用多个功能子页面和不同语言页面承接 # 去除背景的流量,而 pixelcut 将流量主要集中在 1 个页面,并多采用弹窗不跳转拉长时长、提高权重
2、错过窗口期后,观察竞争对手的劣势功能、用户吐槽点,可在功能差异化层面进行优化,SEO 上同时发力;(例如,放大图片清晰 vs 竞对图片质量降级;主攻 AI 背景和图片背景多样性 vs 竞对 AI 背景踩坑)
3、SEO 的努力方向与产品本身/优势功能契合,才能真正锁住流量,SEO 的精髓,要回归用户体验。insMind 的“失败”,刚好是太过于流量导向而又缺少关键差异点来确保留存。
“现在的创业,时机非常重要,在合适的时间点去发布一款产品,然后不断去强化自己的竞争力,如果错过那个时间点,你又没有差异化,根本不能可能做过别人。”曾做出过 2 款访问量几百万的 AI web 的创业者如是说。
也许在 AI 商品图这个赛道,很难再出现出海企业后来居上的景象。“我们不觉得在这个时间段,与 Photoroom 竞争 AI 商品图,还有什么意义。”面对整个 AI 商品图的竞争格局,一位从业者这样告诉白鲸出海。
这种流量的两极分化,不仅仅体现在腰尾部初创产品上,几个大厂近期上线的产品也难逃趋势。
快手的 AI 商品图产品 poify上线 3 个月,现在流量不到 1w;阿里的 Pic Copilot 5 月份流量 25w 左右,2 个月前还有 50w 左右。背后原因除了工具类产品对大厂吸引力不足、投入有限之外,其实也有 AI 商品图/模特图面临的另一个问题,即更倾向于“讨好”消费者的电商平台方,面对 AI 生成的商品图可谓左右为难,典型例子就是淘宝上半年整治 AI 假图,虽说 AI 商品图不等于假图,但这也表明 AI 参与到电商行业后,已经引发了一些问题,现阶段的技术能解决的问题依然有限,难以真正有效地大商用范围。
综合起来,就有了创业者们感受到的“太卷”—— 随着 AI 技术迭代,头部企业努力优化产品来扩充用户盘子,但实际落地效果短期内难有飞跃,形成增量有限的局面;与此同时,赛道参与者众多,给流量获取带了更大的难度。
二、Kontext 来了,机会来了?
从流量回归产品,我们在调研这类产品的时候,会发现在商品图的美好宣传与使用者的实际体验之间,始终隔着一道沟壑。
“抠图放在纯色或者简单背景里,其实已经差不多能够落地。但如果放到一些复杂好看的背景里,如果仅用 AI 工具,产品几乎都会变。”在一家出行产品品牌做商品图的贾浩表示。“商品图第一要真实,第二才是好看,产品变了就失去了意义。老板们看了 AI 产品的宣传,感觉立省几十万,但实际上之前作图的流程,都不能省。
复杂的产品,我们会训练 LoRA,但出图有时候还是会变。后来,有些情况下我们就让 AI 出图,然后把产品去掉,剩下AI发挥创意做出的背景图,再用 PS 把产品和背景融合在一起。这其中所消耗的时间也不少。”
去掉背景之后的耳机原图
左右滑动查看更多,测试的3个AI背景里,后2张图都出现了与原产品的不一致,主要集中在头梁和耳罩之间的连接结构 | 测试产品_pixelcut
对于当初更多出海企业押注的 AI 模特图赛道,服装的一致性则更难以保证。
“听话等于服装细节不变,包括纹理、材质、面料、版型都不能变化、而且加了一些光影进来也不能变,而客户要求的结果是听话+AI model 做出指定 Pose+优秀摄影师作品的质感。”很多创企已经转型但一直坚持做 AI模特图(AI 商拍)的 WeShop 的 GM 吴海波告诉我们,“AI 是自由的,客户要的是‘听话’。当你想让自由的 AI 去对齐客户想要的‘听话’,生成的质量就会变差、甚至产品和衣服变形。
当时 AIGC 火了之后,电商这个事情,大家想的都很大,国内的图片量又很大,这是当时很多创企都切到模特图的一个原因,但是做着做着就会发现技术很难实现预期结果,很多人就不做了。”
吴海波告诉我们,对于 AI 商拍(AI 模特图),其实难点也是一样。第一步请模特、第二步找场景,两者结合形成氛围感。WeShop 其实是在服饰保持和场景生成中间,做一个平衡。而事实上,对于图的要求,国内会比海外更高,这也是海外的增速会更快一些的原因。他认为,现象背后主要是2点:
1、国内在 AI 商拍上,供应端更卷一些。
从淘宝和 SHEIN 的图就能看出来,都比海外本地平台拍摄上传的电商图片要更复杂。这背后是国内的商家和品牌从下游或者拍摄公司拿到一张实拍图的成本不高。海外的拍摄成本更高,所以模特图和商品图都会选择更简单干净的背景。因而单纯的 AI 工具,其实很难能够满足国内商家的要求。
2、海外有一类场景是一些 KOL 会发一些东西,他们更追求自然、对细节的要求会弱一些。
现阶段,在用户需求中做平衡,给出尽可能可以落地的方案,是 AI 商品图和模特图努力的方向。“2025 年之后,这也是我们跟竞品之间的一个最大区别,人和背景去放在一起。因为大家做款会参考最近流行的打卡地点、拍照姿势,我们做的就是让产品和背景更好的结合在一起。”吴海波表示。
但是当我们拿着最近被各路自媒体猛吹一致性的 Kontext,问吴海波,是否可能解决 AI 商品图、甚至 AI 模特图一致性的难题,带来“翻身机会”的时候,吴海波认为 Kontext 无疑是对行业的利好,但并不是他期望中的理想架构,用于解决之前存在的一些问题,还需要大家努力做很多适配工作。
直接在 Krea 平台使用 Kontext 模型(非 comfyUI 的工作流),耳机的材质颜色和模型都发生了变化
基于 Kontext 模型的 ComfyUI 工作流,给实拍的耳机加背景,一致性得到了比较不错的保障
人台图 | 来源:网络
AI模特图 | 某产品A
AI模特图 | Photoroom 平台的Virtual Model功能
AI模特图 | WeShop
AI模特图 | Liblib认证创作者Li鱼服装生成模特kontext工作流
面对 Kontext 工作流实现的还不错的效果,吴海波表示,“就我们自己的训练来看,Kontext 去做一个工作流或者 showcase 还是挺好的,但是还没有变成一个成功率大于某一个数值的输出,这样就不会形成客户去购买算力稳定使用,简而言之,就是不能商用。工作流用户分 2 种,偏技术类的专家和尝鲜用户,前者能够在工作流报错的时候自己解决,而工作流报错是大概率事件,后者本来对图片的要求也不高。”(ps: 后续我们用服装平面图测试同一个 kontext 穿衣工作流,出现了衣服直接覆盖在人身上等意外情况)
但对于我们的商业用户来说,他每天是有必须要完成的图片处理量。以我们目前的情况来看,如果抽卡成功率在 20-30%,用 Kontext 可能会降到 5%。
BFL 团队(kontext 模型厂商)还在于将天花板拉高,他们并不 care 这个模型被什么人用于什么领域。而我们做 AI 商拍,虽然在海外某些场景有一些取舍,但一致性依然是最重要的,Kontext 在语言信息的处理上、也就是指令听从还是比较差,他还不是我期望架构的‘完全体’,这个模型的技术思想还是偏传统的,我们希望看到一个开源版本的 GPT-4o 的架构。
但是,在 Kontext 发布之前会有一些难题需要复杂解法,Kontext 出来后,可以做到用比较简单的方案就能解决问题。例如我们之前有一个改变角度来展示服装的功能 #change pose,其实技术思路和 Kontext 有类似之处,因为有一些技术积累,当 Kontext 出现之后我们能很快应用起来,解决方案会变得更简单一些。
WeShop的操作界面及change pose功能
面对最近又有不少创企尝试进入这一赛道,吴海波认为,做应用层的公司,最重要的就是怎样将行业 know-how 做成一个控制模块加入进去。有没有 know-how 非常重要。实际上,整个行业确实在快速增长,但依然很小。加入竞争要思考自己的优势是什么才能活下来。
吴海波解释:“以 WeShop 为例,ARR 每年翻一番、增速很快,但还是一个小事情。技术选型,3-6 个月技术必革新,所以 AI 时代,用户会特别喜新厌旧、到处迁移,ARR 没有意义。
或者打一个比喻,淘宝上自己有货、能投得了直通车、一年的收入能维持一个小团队,在这个标准之上的品牌和卖家对 AI 商拍图,现在是不满意的。他们是现在的这部分需求其实是被“人力密集型”团队承接掉的,说是用 AI,但其实用的是 AI+人工,我们的目标是做纯 AI 工具去服务这批人,但现在行业技术还没有达到那条线。”
参考文章:
1、《被卖家追着跑,这一波AI商拍真香了?》,白鲸出海
2、《AIGC风潮下修图App出路在哪?PhotoRoom示范如何月流水大涨破千万》,白鲸出海
3、《谷歌 SEO 新卷王 Pollo.ai,让我放弃研究 Canva 和Wondershare》,侃侃而亮
4、《OpenAI复制吉卜力,大模型正在吞噬一切产品》,晚点LatePost
本文为专栏作者授权创业邦发表,版权归原作者所有。文章系作者个人观点,不代表创业邦立场,转载请联系原作者。如有任何疑问,请联系editor@cyzone.cn。