编者按:本文来自微信公众号 新智元(ID:AI_era),编辑:乔杨,创业邦经授权转载。
AI大模型的开源政策与成功的商业化到底能不能并行?
前段时间刚刚开源最新模型的Mistral给出了答案——
他们最近在新一轮融资中刚刚获得了6亿欧元的投资,公司估值已经飙升至58亿欧元,股价在短短6个月时间内增长了两倍。
作为一个坚持开源政策的AI公司,成立于远离硅谷的法国巴黎,用60人的团队在1年后就能创造出近60亿的估值(每人每年创造一亿欧元的价值),的确是一个振奋人心的故事。
因此,法国总统马克龙称赞Mistral为「新一代欧洲初创企业与美国科技巨头竞争的典范」。
Mistral从去年6月诞生之初,就充满传奇的光环。成立4周,6人团队,7页PPT,8亿融资(1.05亿欧元),简直堪称爽文走进现实。
目前,公司的3位联合创始人Timothée Lacroix、Guillaume Lample和Arthur Mensch依旧是最大的股东。
公司的60名员工中,45名来自法国,其余来自美国和英国。团队四分之三的成员从事产品开发和研究工作。
同时担任CEO的Mensch表示,了解到投资者的兴趣后,Mistral选择筹集更多资金,以扩大商业化方向的努力并购入更多算力。
他表示「这仍然是一个资本密集型市场。我们拥有的算力越多,团队中可以容纳的成员越多……才能打破人工智能的壁垒。」
随着Mistral用行业内最为高效的开源模型不断震惊业界,他们也逐渐获得了微软,英伟达和Salesforce等大公司的背书。这些巨头通过现金或者算力的支持,换取Mistral AI的少量股份。
说到公司的开源策略,Mensch表示「有人一开始就告诉我们,这个市场永远不会被撬动……但我们证明了,事实并非如此。Mistral有效颠覆了OpenAI的商业模式。」
如今的Mistral,已经可以和OpenAI、Anthropic这些硅谷独角兽相提并论,开发出的Mistral/Mixtral系列模型很可能已经在某些场景中取代了GPT-3.5。
然而,60亿欧元相比OpenAI的800亿还是小巫见大巫。Mistral想要挑战OpenAI,仍需付出不少努力。
为什么Mistral的开源商业化可以盘活?Mensch认为,开源反而使得模型对大型企业客户更具有吸引力。
「在构建商业模式和坚持我们的开源价值观之间找到一个平衡点是非常微妙的。我们希望创造新的事物、新的架构,但是还想向我们的客户提供一些额外的产品和服务。」
相比硅谷,在对隐私、数据和AI监管较为严格的欧洲,人们对AI抱持更加审慎的态度。可供任何人检查或定制的源代码反而成为了公司的竞争优势。
企业客户不想共享数据,也不想依赖美国科技巨头们提供的「像互联网和手机一样具有变革性的技术」。
Mistral在2023年春天向投资者提出的最初方案中,批评了由美国公司主导的「正在形成的寡头垄断」,这些公司开发的是专有闭源模型。
对于Mensch和他的合伙人来说,将他们的初始AI系统作为开源软件发布,允许任何人免费使用或修改,这是一个重要的原则,也是吸引开发者和潜在客户的一种方式。他们希望每个人对自己使用的AI有更多的控制权。
AI科学家,如何创立自己的独角兽
看多了Sam Altman或小扎这样的硅谷新星,Mistral的创始人Arthur Mensch显得比较特别。
Mensch是1993年出生的法国小伙,个头高大,一头浓密的深色头发,既不像典型的科技极客,也不像常见的CEO。
Arthur Mensch
根据朋友和同事们的描述,他总是一边喝啤酒一边轻松地和朋友开玩笑。作为一名运动爱好者,他在2018年提交博士论文前的几个月,以不到三小时半的时间跑完了巴黎马拉松。
Mensch从小就在学术追求与创业之间徘徊。他出生在巴黎西郊,母亲是物理老师,父亲拥有一家小型科技公司。这位未来的CEO毕业于法国顶级的数学和机器学习院校——巴黎综合理工学院和巴黎高等师范学院。
他的导师们将他描述为一个热情投入的学生,能够迅速掌握自己几乎没有基础的项目。
「我确实热爱探索新事物,」Mensch 表示。「我很容易感到厌倦。」
在攻读博士期间,Mensch的研究方向是优化软件,分析核磁共振图像(fMRI)系统的三维大脑图像,让软件能够处理高达数百万的图像量。
2020年底,Mensch加入了DeepMind,在那里他参与开发了大语言模型,具体研究方向是提高AI和机器学习系统的效率。
到了2022年,他以主要作者的身份发表了著名的「Chinchilla论文」。这项研究重新定义了人们对AI模型的大小、训练它所需的数据量以及其性能之间关系的认识,被称为AI缩放法则(Chinchilla/Hoffman Scaling Laws)。
随着2022年AI竞赛的升温,大公司的AI实验室减少了LLM研究成果的发表,也减少了与研究社区的分享,Mensch对于这一情况感到失望。
Arthur Mensch长期以来一直在学术追求和创业追求之间徘徊。
ChatGPT发布后,谷歌决定加速追赶。Mensch所在的团队从一个10人的小团队变为30人,最后扩充成为了一个70人的大团队。
「我觉得应该在事情变得过于官僚化之前离开,」Mensch 说,「我不想在大型科技公司中开发那些不透明的技术。」
于是,工作3年后,31岁的Mensch离开了谷歌,开启了Mistral在种子轮融资时「6人团队,7页PPT,8亿融资」的传奇故事。
2023年,Mensch拉拢了两位Meta Llama团队的成员Lacroix和Lample,决定成立一家公司,通过更加高效的方法构建和部署AI模型。
这几个三十出头的年轻人,在LLM开发领域已经有不少经验。当时,即使在全世界范围内,具备构建、训练和优化LLM专业经验的人,也不超过100人。
6人团队中的另外三位,分别是来自法国巴黎健康初创公司Alan的CEO Jean-Charles Samuelian和CTO Charles Gorintin,以及前法国数字事务国务秘书Cédric O。
他们相信,小团队能力在灵活性上超越硅谷的大公司,而开源模型就是他们实现这一目标的利器。
Mistral AI位于巴黎的办公室
虽然已经从各路投资者那里筹集了超过5亿美元,但他们成立的Mistral AI相比于微软支持的OpenAI,谷歌,乃至Anthropic,依然显得有些「微不足道」。
这些巨头,以及巨头重金支持的巨型独角兽投入了几十亿美元来构建全世界最先进的AI系统。但Mensch并不担心与这些庞然大物竞争。
「我们的目标是成为 AI 领域中最节省资本的公司,」Mensch表示。「这是我们成立的初衷。」
比如他们推出的大杯模型Mistral Large,在执行某些推理任务上能够与GPT-4和Gemini Ultra相匹敌。
Mensch透露,开发这款新模型的成本不到2000万欧元(约合2200万美元)。
相比之下,OpenAI的首席执行官Sam Altman曾在去年发布GPT-4时表示,训练他们公司的大型模型的成本接近1亿美元。
本轮投资由General Catalyst领投,公司的欧洲业务负责人表示,「Mistral的资本效率确实非常出色,相比竞争对手,他们投入尽可能少的资金来构建有竞争力的AI模型。」
「从财务角度来看,这个团队的运作非常灵活,取得的成就让人印象深刻。」
参考资料:
https://the-decoder.com/europes-hottest-ai-startup-mistral-raises-600-million-at-6-billion-valuation/
https://www.ft.com/content/7a70a8a6-4a2a-47c5-8483-d0b829f32ae6
本文为专栏作者授权创业邦发表,版权归原作者所有。文章系作者个人观点,不代表创业邦立场,转载请联系原作者。如有任何疑问,请联系editor@cyzone.cn。