编者按:本文来自微信公众号 定焦(ID:dingjiaoone),作者:王璐,编辑:魏佳,创业邦经授权转载。
“AI一天,人间一年”。
3月6日凌晨,Manus亮相,瞬间点燃了整个科技圈。它被称为全球首款通用型AI Agent(人工智能代理)产品,由国内一家创业团队——Monica.im打造。但这场技术狂欢,迅速陷入争议旋涡。发布仅两天,Manus的口碑经历了数次剧烈反转。
Manus官方将自己定义为一款连接思维与行动的通用人工智能代理,特点是擅长处理各种任务,不仅能思考(听懂复杂指令进行推理),还能交付成果(顺滑对接完成该任务的各个环节,将最终结果给到用户)。
举个简单的例子。
如果让Manus筛选简历,用户只需将存有多份简历的压缩包直接发给Manus,剩下的任务就全部交由它完成。Manus会自动解压缩文件,浏览找出重要信息,给出候选人评估结果,还可以将候选人姓名和重要信息做成表格,方便用户查阅。
在此过程中,用户不仅可以关闭电脑,还能随时添加其他任务。
有了Manus,普通HR的日常工作似乎变得“多余”。这也让许多人惊呼,取代打工人的“AI牛马”真的来了。
不过,Manus属于“黑红”体质。
发布之初,它被冠以“炸裂”、“拳打ChatGPT”、“比肩DeepSeek”、“震撼硅谷”等名头,风光无限。不久后质疑声接踵而至,有人认为它过度营销,技术没有太大突破实为“套壳”,噱头远大于实际能力。
紧接着,其内测邀请码被炒到10万元天价的消息传出;它在X平台上的官方账号被冻结,显示原因为“违反平台规则”。随后,Manus联合创始人兼首席科学家季逸超公开回应称,账号被冻结可能与第三方提及加密货币诈骗有关,该领域与Manus的运营完全无关。
这一系列事件,更加深了外界对Manus的疑虑。这款备受瞩目的产品,究竟是真正的技术革新,还是营销噱头?未来又能火多久?
争议中的Manus,
真有实力还是套壳工具?
Manus爆火两天,外界对它的评价极为两极分化。
一部分人觉得Manus让AI Agent又上了一个台阶,马上就要抢走打工人的饭碗,也有一部分人认为它只是个套壳工具。
来看它“封神”的点。
相比市面上已经出现AI Agent(比如豆包、文小言都内置了很多智能体),Manus的优点之一在于,处理复杂任务时具备自主性、连续性。
比如用户只需给出一段比较详细的提示词,Manus便能自主解读、拆解并给出结果,还能进行自我检查,省去了一步步的对话引导步骤。
由于Manus是基于云端异步运行,用户下达完指令后关闭页面都不会影响Manus处理指令,任务完成后还会自动通知用户结果。
Manus的另一大亮点,是号称全球首款通用型AI Agent产品。
需要注意的是“通用”二字,指它能够处理各种各样的任务,不限任何领域,比如支持筛选简历、房产调研、股票分析等多场景。
然而,对于这两大亮点,也存在着不少质疑的声音。
首先,由于Manus处于内测阶段,采用邀请码制度,大多数用户尚未真正使用过该产品,目前对其“惊艳”的评价大多源自官方发布的演示视频。鉴于过往许多AI产品都存在“样片水平大于实际实力”的情况,部分从业者认为Manus的真实能力有待进一步考量。
其次,对于Manus的“通用性”,部分从业者认为,存在套壳嫌疑。
有从业者评价,Manus没有自研底层大模型的能力,其模型能力主要来源于国外Anthropic的Claude。而且,很多场景和功能早已在其他Agent中实现。比如,Devin作为全球首个AI程序员,也是一个能独立完成写代码任务(学习新技术、调试代码到部署应用程序)的AI Agent,在去年年底便面向公众开放。
从这个角度来看,Manus更像是给现有的各类AI应用加了个壳子,把DeepResearch(OpenAI推出)、Computer Use(Anthropic推出)等应用汇总了起来。
AI软件工程师覃相告诉「定焦One」,Manus是基于现有大语言模型的调用,并未涉及底层技术突破。比如在进行股票分析时,Manus通过调用雅虎金融API获取数据,再借助编程语言生成可视化图表,依赖的都是现有的技术和工具。
参加了Manus闭门分享会的AI博主自动华也对「定焦One」表示,制作团队分享了Manus作为AI员工主要做的三件事:配电脑(赋予AI访问浏览器和工具的能力)、配权限(接入私有API和权威数据源)、给培训(用户可以通过反馈实时调整AI行为)。
可见,Manus本质上是将各种工具进行拼接,其能完成跨应用这类复杂任务,依赖的是Claude模型,以及接入的各类智能体工具。
至于“套壳”“拼接”是否算作创新,业界观点不一。 支持者认为,这种整合方式能够快速实现多种功能,为用户提供一站式解决方案,具有一定的实用价值;反对者则认为,这种模式只是基于现有技术进行简单组合。
但从业者基本都认同,从技术维度上看,Manus还远称不上是下一个DeepSeek。
如何正确看待Manus?
比起技术,Manus走红的关键在于用户体验。
减少了操作步骤,执行过程中不用反复和AI对话,还可以关闭界面,这都是过往AI Agent产品所不具备的。
自动华认为,AI Agent的意义在于帮助普通人提效,Manus重新定义了AI应用的价值指标,由重视DAU(用户留存)变到AHPU(Agentic Hours Per User,用户使用AI完成任务所耗费的时间)。
“正是这样的benchmark(可简单理解为评估指标),决定了产品优化路线,让Manus和市面上其他AI Agent产品有了区别。”自动华表示。
他解释,传统互联网产品都是“注意力经济”,希望占据用户更多的使用时间,最终通过广告变现,所以将五花八门的垂类Agent放到了产品中。
Manus的定位是通用型AI Agent,在执行同量任务情况时,试图让用户花的时间越短越好,所以它做了一个大整合,希望用越快的操作方式、越少的操作步骤为用户提效。
这与团队的过往背景有关。Manus背后的团队在2023年开发了AI浏览器插件助手Monica,他们发现浏览器作为单用户场景存在人机控制权冲突,AI频繁打断用户体验的痛点,由此得出“AI应拥有独立云端浏览器”。
自动华觉得,正是由此他们提出了“Less structure, more intelligence”,主张减少对AI的结构化限制,依赖模型自主进化能力,而非人工预设流程,才让Manus区别于传统 AI Agent。
这也是大部分用户对Manus感到兴奋的点。覃相将Manus比作“数字代理人”,能自动拆解复杂指令、替用户完成多个任务,而且执行速度快,在任务执行和用户体验上超越了豆包和百度的AI Agent。
覃相还进一步分析Manus核心优势背后的技术原理:多代理架构、强自主学习能力。
首先,Manus具备多代理架构与任务分解能力,它采用了多智能体系统架构,能够将复杂任务分解为多个子任务,并通过不同的智能体协同完成。这种架构使其能够高效处理长尾任务。
其次,它具备自主学习与记忆功能,能够记住用户的偏好,并在后续任务中主动调整策略。这种自主学习能力使其能够不断优化任务执行逻辑,逐渐从被动响应转向主动服务。
不过,在速度提升时,准确率也是需要重点考虑的要素。
Manus官方指出其具有低错误率,在GAIA(一个专为通用人工智能助手设计的基准数据集,主要用来评估 AI的基本能力)中,面对基础(整理文件、数据分析)、中等(调用API、写代码)、复杂(逻辑推理、多模态处理)三个级别的任务测试,其分数都超过了OpenAI的DeepResearch,但低于人类平均正确率92%,仍不如人脑聪明。
正如前文所说,由于产品还未大范围铺开,从业者对其实际效果持怀疑态度。很多博主在测评中发现,Manus在处理中等复杂的任务时,出现了长耗时问题;在访问需要登录的网站或处理付费墙内容时,也会出现卡顿,还是需要用户手动接管。
Manus的下一步,
成本、技术、市场竞争
Manus的争议不小,但被捧得很高。很多人担心,Manus正式上线后,如果实力与预期不符,很有可能消耗掉DeepSeek为国内AI积攒下来的正向价值。
自动华告诉「定焦One」,在Manus的闭门分享会上,官方也提到了将面临的一些问题。比如未来的产品战略会朝着优化成本和提升运行速度努力,同时他们也在寻找一个与成本相平衡的商业化定价模式,所以距离公开上线还会有一段时间。
这些挑战中,成本问题尤为突出。
“Manus单任务运行成本约2美元,虽然仅为竞品DeepResearch的1/10,但相比于豆包的单次任务调用回答,却昂贵了非常多倍。”自动华表示,在他看来,Manus调用的算力和生成结果的质量与竞品存在差异,但在目前国内大模型产品普遍免费的背景下,这种AI一次性完成高质量结果对应的付费模式,还有待探索。
目前,大多数普通用户为AI产品付费的意愿较低,尽管是功能强大的AI软件工程师Devin,高昂的月费(500美元)导致使用它的人很少。
这也是Manus需要邀请码才能使用的重要原因。从业者认为,官方之所以不全面放开使用权限,一方面可能是“饥饿营销”,但更重要的是,要考虑商业价值和成本的平衡。
用户多了很有可能导致算力跟不上。“Manus的底层是依靠大模型能力,算力紧张可通过加显卡解决,但很多公司支付不起背后高额的成本,特别是Monica还是一家创业公司。”自动华表示,Kimi在刚推出市场时也遭遇过类似问题,也没有轻易选择加显卡。
其次,当前AI Agent还做不到像人类一样聪明,解决问题的能力相对有限,Manus也同样面临着这一问题。
比如,最容易出现的情况是对用户问题理解不清晰,同一个问题反复问AI Agent好几遍,生成的答案还是无法达到与人类认知相匹配的标准。
因为AI Agent在执行任务时的思考方式是,复现成熟的任务流程或通过训练数据对问题进行简单拆分,归根究底,还是依赖于大模型的基础能力。Manus并没有在这方面做出强技术突破。有使用者指出,Manus对复杂问题的拆解能力仍处于较低水平。
以及Manus即将面临的市场竞争压力也不小。
覃相认为,豆包和百度的AI Agent也有各自的市场定位和技术优势,未来它们可能会通过技术升级或差异化竞争,缩小与Manus的差距,而且这两家公司的资金实力更强。
对于Manus的火爆,很多人持观望态度。不止一位投资人对「定焦One」表示,虽然他们很看好今年AI Agent的发展,但由于之前有类似AI程序员Devin的出现,Manus并没有太惊艳到他们,核心技术问题也没有得到根本性提升。
此刻,相比DeepSeek护城河较低的Manus,已经有不少开源复刻版项目出现,留给Manus的时间不多了。
*题图及文中配图来源于Manus官网截图。
本文为专栏作者授权创业邦发表,版权归原作者所有。文章系作者个人观点,不代表创业邦立场,转载请联系原作者。如有任何疑问,请联系editor@cyzone.cn。