90后清华学霸拿下10亿美元融资,AI公司月之暗面

2024-02-21

国内AI大模型公司迄今为止单轮最大金额融资来了!AI初创公司月之暗面完成新一轮超10亿美元融资,投资方包括红杉中国、小红书、美团、阿里,老股东跟投。

根据睿兽分析数据显示,月之暗面的上一轮融资为2023年6月获得的超2亿美元投资,投资方包括红杉中国、真格基金等。

本轮融资后,月之暗面估值已达约25亿美金,为国内大模型领域的头部企业之一。

月之暗面的创始人杨植麟是 90 后学霸,他毕业于清华大学交叉信息学院。在卡内基梅隆大学(CMU)读博时,他又师从苹果AI研究负责人Ruslan Salakhutdinov、谷歌首席科学家William Cohen。他用4年时间完成了一般6年才能完成的CMU博士课程。

他曾就职于FAIR和Google Brain,是Transformer-X与XLNet论文第一作者。这两篇论文在深度学习领域影响深远,在Google Scholar的引用次数之和达到了惊人的上万次。

2023年6月,科技媒体The Information曾列出了有可能成为“中国OpenAI”的五个候选,包括MiniMax、智谱AI、光年之外以及澜舟科技,而另一个位置就是杨植麟,其他都是公司,而他直接是一个个体。

两位联合创始人周昕宇和吴育昕也均出身清华。团队还有来自Google、Meta、Amazon等巨头的海外人才,团队成员约为50人。

2023年10月9日,这家成立仅半年的大模型初创公司 —— Moonshot AI宣布在“长文本”领域实现了突破,推出了首个支持输入20万汉字的智能助手产品Kimi Chat。并称,这是目前全球市场上能够产品化使用的大模型服务中所能支持的最长上下文输入长度。

大模型输入长度普遍较低的现状对其技术落地产生了极大制约,例如在Character AI的社区中用户经常抱怨“因为角色在多轮对话后忘记了自己的身份,所以不得不重新开启新的对话”。

相比当前市面上以英文为基础训练的大模型服务,Kimi Chat最大的特色就是具备较强的多语言能力。

Kimi Chat在中文上具备显著优势,实际使用效果能够支持约20万汉字的上下文,2.5倍于Anthropic公司的Claude-100k(实测约8万字),8倍于OpenAI公司的GPT-4-32k(实测约2.5万字)。


例如:公众号的长文直接交给Kimi Chat ,它可以快速总结分析;发现了新的算法论文时,Kimi Chat能够直接帮你根据论文复现代码;输入整本《月亮与六便士》,Kimi Chat可以和你一起阅读,帮助你更好的理解和运用书本中的知识等等。

2023年11 月,公司宣布其 Kimi Chat 聊天机器人面向全社会开放服务,用户可通过官网体验。

对上下文长度的Scaling Law的探索已经迅速成为一种趋势。GPT-4从一开始的4k、8k拓展到了GPT-4-turbo的128k,Anthropic将Claude2迭代到了200k的长度,国内的百川智能、零一万物也陆续开始逼近200k的文本长度。被OpenAI抢了风头的Gemini 1.5 Pro近日一次性将文本输入长度拉到10M。

据了解,月之暗面当前还在秘密研发通用多模态模型,预计今年内将推出。

从国内的AI竞赛来看,通用大模型领域的第一梯队也已经清晰展现。据当前公开信息,除月之暗面以外,包括智谱AI、MiniMax、百川智能、零一万物在内的创业公司,估值都已达10亿美元。

月之暗面的蓄势待发,让我们看到大模型领域的竞争已然掀起狂澜,群雄并起。其余国内大模型企业融资及发展情况如何?睿兽分析将持续关注。


来源:睿兽分析