DeepSeek奇袭,一场技术权力格局重构的开端?

关注
资本市场的过度反应已经证明,此前烧钱模式泡沫摇摇欲坠。

编者按:本文来自微信公众号 硅兔君(ID:gh_1faae33d0655),作者:Joanne Gu,创业邦经授权转载。

就像一部不知名小团队拍的国产非主流电影,一举让大制作的好莱坞大片票房扫地,过去24小时里,发生在DeepSeek这家中国大模型公司身上的爽文剧情,让美股付出了血的代价。

DeepSeek的独特在于,在算力资源受限的情况下,团队通过对模型架构的优化,仅用 2048 块英伟达 H800 GPU 和 557.6 万美元成本就做出了规模达 6710 亿参数的 DeepSeek-V3,而同行同等参数规模的模型成本约为 10 亿美元左右,其最新推出的 DeepSeek-R1 模型的推理成本甚至仅为 OpenAI 新模型(o1)的三十分之一。

尽管外界对此真实性存疑,但是,恐慌情绪仍旧在短期内支配了华尔街——更具性价比的解决方案出现了,这是否意味着过去以大算力、高成本为核心的硅谷公司们的估值体系不再继续?

1月27日,就在DeepSeek应用在苹果中国地区和美国地区应用商店免费APP下载排行榜上双双登顶的同一天,截至美股收盘,纳斯达克综合指数跌3.07%,标准普尔500指数跌1.46%,AI算力“军火商”英伟达大跌超17%,市值蒸发超5600亿美元,一日抹平今年以来股价所有涨幅。也创下了美股史上单日市值蒸发新纪录。并带动芯片股集体大跌:博通跌逾17%、AMD跌超6%、阿斯麦跌超5%。此外,谷歌、特斯拉、微软也有不同程度的下跌。

目前,硅谷AI巨头正在研究DeepSeek的技术以验证其发展路径的可行性,这种关注本身不仅是对现有AGI估值体系的怀疑,对美国科技界和特朗普政府来说,更大的挑战在于,如果DeepSeek确实如其所说找到了更便宜的解决方案,这意味着美国对华先进AI管制的一次失灵——对习惯了领先世界的硅谷AI模式来说,如何在自我革命与封闭保护之间做平衡,或许将比应对DeepSeek本身更艰难。

DeepSeek重挫美科技股,会是一场技术权力格局重构的开端吗?

01戳破AI泡沫

目前,外界对DeepSeek的怀疑主要集中在三点:

首先,成本存疑,伯恩斯坦分析师称,DeepSeek声称其模型的开发仅花费了 560 万美元的计算能力,这是不可能,他认为这个数字忽略了与其 AI 模型开发相关的其他相关成本。

其次,原创性存疑,DeepSeek 利用的开源技术,是基于Llama以及OpenAI大模型,因此并不是技术从0-1,而是从1-10,换句话说,DeepSeek模型的优势可能根本无法离开OpenAI、Meta 们打下的基础,只是利用工程学的手段将精确性放大。

最后,市场上还有不少观点认为,美科技股市值大跌是一场对冲基金和媒体的合谋,做空机构夸大DeepSeek的效果以制造恐慌,从中牟利。

尽管疑虑重重,股市的震荡确实可能只是短期,但从长期来看,围绕DeepSeek后续影响的或许是这种廉价路线是否会改变硅谷AI的竞争策略和市场逻辑?

过去,硅谷AI公司如OpenAI和Anthropic吸引了巨额融资,估值高达数百亿美元。瑞银2024年数据显示,美国大型科技公司当年在人工智能资本开支达到2240亿美元,预计2025年将增至2800亿美元。然而,如果DeepSeek路线若成功,这意味着现有AI投资逻辑被颠覆。

首先受到影响的是美国企业的估值。英伟达是生成式人工智能热潮中的最大受益者,此前,创始人黄仁勋多次强调GPU芯片需求强劲,全球数据中心市场规模已达2500亿美元并以每年20%至25%的速度增长,这种持续性保证了英伟达的持续增长。因此,从反面来说,若DeepSeek之类的企业能证明无需费用高昂以及一流的GPU即可训练强大AI模型,英伟达目前估值将难以为继。

英伟达方面今日就股价波动已经回应媒体称,DeepSeek是一项卓越的人工智能进展,也是测试时扩展的绝佳范例。DeepSeek的研究展示了如何运用该技术,借助广泛可用的模型以及完全符合出口管制规定的算力,创建新模型。与此同时,推理过程还需要大量英伟达GPU和高性能网络。

1月21日,特朗普政府刚刚推出了旨在将美国打造成“算力帝国”的“星际之门”(Stargate)项目,这是一项大规模人工智能基础设施投资计划,由OpenAI、软银、甲骨文等多家企业联合打造,计划在未来四年投入5000亿美元,用于在美国建设支持AI发展的基础设施。项目初期投资为1000亿美元,旨在建立数据中心用于训练和运行AI模型。这一投资的逻辑正是基于通过大规模AI算力投资来扩大美国在AI技术上相对于其他国家的领先优势。

不过,资本市场的过度反应已经证明了,此前烧钱模式的泡沫摇摇欲坠,无论DeepSeek的路线能否被复制,市场大概率都会重新审视AI发展路径。

花旗的观点认为,DeepSeek发布后,针对计算成本的讨论将会上升为一个关键话题。但是,美国科技公司不会放弃对先进芯片的争夺,此前美国政府宣布投入5000亿美元的“星际之门”也证明了这一点。

对产业界来说,DeepSeek的高性价比将可能迫使硅谷重新评估研发策略,可能加速企业从闭源转向开放合作模式。已经有消息称,Meta成立了4个研究小组来评估DeepSeek工作原理。

DeepSeek还可能加速风投机构的投资策略调整。过去,拥有更高算力的初创公司是资本的宠儿,而未来,像DeepSeek这样专注于低成本高效解决方案的团队可能会获得更多的关注。

微软CEO萨蒂亚・纳德拉在达沃斯世界经济论坛上表示,DeepSeek的新模型令人印象深刻,开源模型在推理计算方面表现出色,必须非常认真地对待中国的这些进展。

02特朗普怎么看?

DeepSeek后续影响的第二个可能是,DeepSeek是否会影响特朗普政府对华AI出口管制政策?

DeepSeek并未使用最先进的AI芯片。DeepSeek表示,它使用的是没那么先进的英伟达H800芯片,这种芯片在2023年10月前尚被美国政府允许出口至中国。DeepSeek创始人CEO梁文峰去年在接受采访时也强调:“钱从来都不是我们的问题。美国对先进芯片的限制才是问题所在。”英伟达今日已经做出了回应,DeepSeek所使用的芯片是完全合规的。

这与目前美国的AI限制逻辑相悖。拜登政府自2022年10月起开始严格限制高端芯片流入中国,并在拜登任期最后三个月内四度加码,目的是希望通过限制芯片来限制中国开发出尖端人工智能,而DeepSeek证明了在这种限制之下中国公司正在被迫另辟蹊径——不依赖尖端芯片,而是寻找优先考虑效率,更便宜的方式来训练其模型。

这意味着现行美国芯片管制,似乎正在加速中国从另一个维度在AI竞争取得领先,这种管制也并没有像想象中拖慢中国的AI水平。

除此之外,产业界亦有讨论认为,DeepSeek的成功离不开美国开源模型的贡献。考虑到拜登政府曾考虑过对开源模型进行出口管制,美国是否会限制中国参与开源模型,也是接下来可能出现的政策变动。不过,基于开源的技术即所有的开发者都能够参与其中,很难从政策层面完全禁止。

已经有声音要求特朗普政府加大管制力度。1月27日,美国国会议员呼吁特朗普政府实施更严格的出口限制,以阻止中国在人工智能方面取得进一步进展。

不过,产业界亦有观点认为,DeepSeek正是说明了这种现行的芯片管制思路的不可取,由于此前拜登政府的层层限制已经引起了美国科技界人士反弹,预计在此次DeepSeek事件将会促使更多美国芯片公司向政策方进行施压和游说,改变管制思路。

英特尔公司前CEO帕特·基辛格对中国团队的工程能力做出了肯定,“工程学是关于应对约束的。出口管制限制了资源的可获得性,因此中国工程师需要发挥创造力,他们确实做到了。”

上周,特朗普签署了一项行政命令,撤销了拜登政府一项有关人工智能发展的规定,称这些规定阻碍了人工智能产业的发展。白宫人工智能和加密货币事务负责人戴维·萨克斯认为,DeepSeek的成功表明人工智能竞赛非常激烈,美国不能自满,他同时支持特朗普废除前总统拜登的行政禁令。

1月28日,特朗普表示,DeepSeek给美国产业敲响警钟,美国需集中精力赢得竞争。他称,“今天和过去的几天,我在阅读关于中国公司的消息,尤其是一家推出了更快、更便宜的AI的公司。这是好事,因为你可以不用花那么多钱了,我很正面地看待这件事。”

无论如何,接下来的必然是,DeepSeek已经进入美国主流科技界和特朗普政府的关注范围。换句话说,在中美科技博弈下,DeepSeek成为了一个全新变量,今后任何决策和动作恐将难以脱离外界洪流的影响。

1月28日凌晨,DeepSeek宣布发布开源多模态人工智能模型Janus-Pro,其中Janus-Pro-7B在GenEval和DPG-Bench基准测试中将OpenAI的DALL-E 3和Stable Diffusion击败。

本文为专栏作者授权创业邦发表,版权归原作者所有。文章系作者个人观点,不代表创业邦立场,转载请联系原作者。如有任何疑问,请联系editor@cyzone.cn。

反馈
联系我们
推荐订阅