智谱从 DeepSeek老家杭州融了一大笔钱

关注
杭州城投产业基金等参投,智谱GLM下一代模型即将发布。

编者按:本文来自微信公众号 硅星人Pro,作者:王兆洋,创业邦经授权发布。

3月3日,智谱公布了最新一轮融资:本轮战略融资金额超10亿元人民币,参与投资方包括杭州城投产业基金、上城资本等。智谱称:此次融资旨在推动智谱国产基座GLM大模型的技术创新和生态发展。

这是 DeepSeek 浪潮席卷太平洋两岸的 AI界,一众硅谷和中国的大模型明星创业公司都显得黯然失色,投资界重估大语言模型标的价值之际,一次罕见且具有标杆意义的融资动作。

最有意思的地方在于:在DeepSeek如日中天时,智谱悄悄地在 DeepSeek老家杭州,融了一大笔钱。

1 杭州为什么要“抢”智谱

根据公告,智谱已在杭州成立了浙江智谱新篇科技有限公司,将服务浙江省和长三角地区的经济实体以及人工智能的产业转型升级。

在此之前,2024年12月17日,智谱曾完成一轮30亿元人民币融资,投资方包括多家战投及国资,再之前的9月,中关村科学城公司以投前200亿元估值领投智谱 。

再往前的2023年,智谱也先后完成多轮融资,投资机构包括从社保基金中关村自主创新基金,到互联网大厂美团、蚂蚁、阿里、腾讯和小米等,以及头部VC红杉和高瓴等。

智谱的融资动作一直有风向标的意味,而此次让杭州去北京“抢人”,也出现在一个微妙的节点。

当前围绕着中国科技创新高地最热闹的话题之一,就是DeepSeek和杭州的关系,它甚至让各地展开了“为什么DeepSeek不出在我们这里”的反思风潮。反思声浪未停,已经坐拥DeepSeek的杭州再下一城,成了智谱的战略投资方。

它体现了DeepSeek的冲击波后,AI 产业开始更成熟和客观地的理解DeepSeek带来的机会和挑战。

今天,越来越多的人开始将DeepSeek视作一个更像AI 实验室的公司,从它发布的开源模型,到技术论文,再到最近的公布基础设施核心代码的开源周,DeepSeek在追求AGI的技术架构原理上单兵深入,而对面向企业与政府服务的商业化场景和C端用户没有展现出太大兴趣。面对汹涌而至的C端流量和政企客户纷纷接入的诉求,深知有点力不从心。

但是,DeepSeek现象加速了中国各行各业全面加快AI基础设施建设的信心。也因为DeepSeek无意于满足、也满足不了所有人的需求,对已经在过去两年全面铺开的大模型商业化市场里的头部玩家,实在是一次扩张的机会。

硅星人从接近智谱的人士了解,智谱MaaS平台的API的付费收入,在2025年春节后已经增长30%。

另外,在DeepSeek引发的最近的开源讨论里,有人根据他们提供的计算效率,推算出要满足全球的AI计算消费需求(每天为世界每个人生成10k token),其实只需要24万张GPU的算力即可。但今天的问题是,这些需求在哪里?一家模型技术能力够强的商业化运作公司,有能力深入场景里把需求打捞和捕捉出来,反而变得更重要了。

作为一家全链路国产自研的中国大模型公司,GLM基座模型的拥有者和最早全方位布局各行各业商业化的中国AI头部企业,智谱可能是最懂得产业需求的那一个。

此次的融资,也非常“智谱”——再次得到又一个地方政府的产业资金下注。这也再次让人关注智谱的“国家队”身份在今天的意义。

智谱在去年底已经成了第一家被美国商务部列入实体清单的中国大模型公司。今天,当讨论AI竞争时,地缘政治已经不可避免地被推到了最前面的位置。

在这种背景下,尤其是美国的特朗普新内阁也推出“星际之门”(StarGate),用国家意志带动商业公司投资AI 基建的情形下,没有人能否认:政府背景的资金注定要在这场资金密集的竞争里扮演关键角色。

它不是补贴,而是长期投入。智谱公布的融资信息特意强调了智谱GLM系列大模型在金融、医疗、教育等多个行业的实际应用。

当DeepSeek解决了让每个人都有10k token可以用的理论问题,怎么把把这些token 真正用到最需要的场景里,并且用到位,就得看地方国资和智谱这样的公司怎么一起合作了。

2 即将发布和开源各系列全新大模型

此番超10亿元人民币的融资是智谱在“DeepSeek旋风”席卷后的第一个明确响应。而根据硅星人从接近智谱的多位人士处了解,智谱内部对DeepSeek给技术和行业带来的改变,已经做出自己的判断和诸多应对调整。

在技术路线上,智谱内部明确了继续加大投入,训练基座模型,提升模型能力性能的目标。同时,对于R1体现出的方向,智谱认为与其对下一阶段发展方向的判断吻合。

在最近的巴黎AI安全会议上,智谱创始人唐杰分享了他对AI发展方向的思考,他提到,接下来的一个重点将是“沉思模型”,也就是拥有类似Deep Research这样能力的模型。“这样的具备自我学习能力的 AI 可以自主解决开放域问题,即使是从未见过的问题,它们也可以像人类一样通过不断尝试、不断探索来解决。”

硅星人独家获悉:智谱正在训练他们的下一代“沉思”模型,而且公司将2025年定义为开源年,接下来也很快会发布和开源各系列全新大模型。

如果仔细研究智谱这家公司的历史,会发现,这些动作不算“转向”,而更像对最初的路线的再确认。事实上,DeepSeek的各种动作,都在客观上刺激着这个行业各个链路里的公司重新思考他们的初心。

对智谱来说,这是一家中国最早研究大模型的机构,2021 年,智谱提出自己的模型算法 GLM,同年训练了 MOE 架构的首个国产万亿模型悟道。据参与当时项目的研究员此前对硅星人讲述,这个模型从第一天决定训练,就选择了“手搓国产芯片算子”的路线,这种最难、但长远意义重大的事情,定义了这家公司的本色。

在今天回看很有意思的地方是:智谱此前的GLM基座模型,以及基于它先后推出的GLM-4-Plus、AutoGLM、GLM-Zero-Preview等,也是在算力规模不及 OpenAI 十分之一的条件下研发出来的同等级模型。而且GLM也是一个当时少有的与GPT路线不同的架构,最初也是通过开源获得了全球技术社区的认可。

用少量算力资源办AGI的大事,走开源路线,其实也是智谱的底色。

这些让智谱事实上成了今天有着最全类型模型的公司之一——智谱开发了基础模型GLM-4-Plus,多模态理解模型GLM-4V ,探索复杂推理的模型 GLM-Zero ,视频生成模型CogVideoX,同时还有创新实验性的AutoGLM、 GLM-PC等。

与其他公司相比,智谱也是最明确给AGI列出路线图的公司。

根据唐杰的分享,他把AGI分成五个阶段,L1展现世界知识与推理能力;L2 时多模态对齐后拥有更深层次的推理能力;在 L3 层,原生多模态模型可以实现如人类般的感觉和联觉(Synesthesia),以及物理世界和虚拟环境的结合,而且,在L3 自我学习阶段,AI 可以通过自我批评、反思、甚至沉思来实现自我学习;L4 时,机器开始实现自主学习;L5 意识智能是 AGI 的最后一级,即 AI 在未来某一天会具备某种意识,可以像人一样去突破现有天花板,去探索、研究、寻找科学的新边界。

唐杰在巴黎AI峰会上分享时表示:我们目前处在L2和L3的交汇处。

可以看出来,这个过程是一个各种技术拼图最终拼在一起的过程。所以当接下来整个行业向模型的融合转向时,谁能在基座模型之上,把推理模型,多模态模型,融合为一个新的形态的更强的模型,谁可能就找到了下一次大的范式创新,而做到的前提,是先要拥有这些需要的拼图。

这种趋势已经在AI Agent的方向上得到预演。AI Agent是一个融合多个模型技术的概念,智谱这种对整个路线里各个环节的全面的追求,在Agent上得到体现。

智谱是最早开始研究Agentic LLM的公司之一,相较今年1月推出智能体 Operator和Deep Research的OpenAI,智谱此前也发布了智能手机可用Agent,以及AutoGLM和GLM-PC,并把Agentic GLM放到了三星手机上。

“2025 年,自主的、具有代理能力的大型语言模型(Agentic LLMs)将成为日常生活和工作的一部分。”唐杰在巴黎AI峰会上说。

DeepSeek对OpenAI们的“反超”说明一件事,AGI实现的过程依然是一个马拉松,在整个漫漫长路上,带头者会交替担任,最终变成一个群体接力实现最终目标的过程。

这场群体接力赛的队员中,有DeepSeek,也有智谱,还会有其它的中国玩家。

本文为专栏作者授权创业邦发表,版权归原作者所有。文章系作者个人观点,不代表创业邦立场,转载请联系原作者。如有任何疑问,请联系editor@cyzone.cn。

反馈
联系我们
推荐订阅