编者按:本文转自极客公园,作者黎诗韵、张勇毅,编辑靖宇,创业邦经授权转载。
仅仅在登顶中国和美区苹果应用商店 24 小时后,国外科技巨头和监管层,对于 DeepSeek 的态度就发生了逆转。短短两天内,这家全球瞩目的中国 AI 新秀正面临着来自硅谷和华盛顿前所未有的压力。
1 月 28 日,Sam Altman 刚发文称 DeepSeek 的 R1 模型「令人印象深刻」,美国总统称 DeepSeek 是「很积极的技术成果」——而在第二天,OpenAI 突然改变立场,对媒体指控 DeepSeekSeek 未经许可「蒸馏」了其专有技术。
美国多位官员也发声支持这一指控,包括特朗普的人工智能顾问大卫·萨克斯(David Sacks)、特朗普提名的美国商务部长霍华德·卢特尼克 (Howard Lutnick)——「DeepSeek 利用『窃取』的美国技术和先进半导体,用极低成本创建了强大的人工智能模型。」Lutnick 当日表示。
特朗普的人工智能顾问大卫·萨克斯(David Sacks)指控 DeepSeek | 图片来源:X
而白宫新闻秘书卡罗琳·莱维特(Karoline Leavitt)则声称,美国官员正在评估 DeepSeek 对美国国家安全的影响。几周前,美国商务部工业和安全局(BIS)刚将智谱增列至出口管制实体清单(Entity List),智谱成为 AI「六小龙」中第一家被列入实体清单的大模型公司。
这一切源自 1 月 20 日 DeepSeek 发布的 R1 推理模型——它在多个逻辑任务(包括数学和编程)上的表现与 OpenAI-o1 旗鼓相当(并且远超 ChatGPT 各版本),而其运行成本仅为 OpenAI 费用的约 2%。这极大冲击了国外科技巨头的价值,微软、英伟达、甲骨文和谷歌母公司 Alphabet 等人工智能相关科技股暴跌,市值总计蒸发近 1 万亿美元。美国监管层对 DeepSeek 的态度也随之转向。
在 OpenAI 发出指控的第二天,另一家美国科技巨头 Anthropic 则直接建议阻止 DeekSeek 等中国公司的创新。1 月 30 日,Anthropic CEO Dario Amodei 发文呼吁美国政府加强对中国的芯片管制,以确保 AGI 只发生在美国。
这同样引起了政府的回应。同日,外媒援引消息人士的话称,美国正在考虑对售华芯片实施额外限制的可能性,其中包括 Dario 建议限制的芯片 H20。
两天之内,美国科技巨头及监管层对 DeepSeek 的态度由溢美转向压制,反映了其对自身「科技霸权」动摇的深层忧虑。随着 DeepSeek 等中国科技公司日益立于潮头,大洋彼岸的技术封锁也从算力、扩展到了模型等更广泛领域。目前的事件或许只是一个开端。
或许,历史将证明封闭和封锁并非维持优势的有效手段,甚至反而可能催生出如 DeepSeek 的巨大创新。开放与合作才代表未来。
而在这个未来到来之前,以 DeepSeek 为代表的中国科技公司,或许需要找到长期的应对之策。
「蒸馏」不等于「窃取」
此次 DeepSeek 的大模型「蒸馏」争议,起源于 OpenAI 的最大投资方微软。
1 月 29 日,外媒报道,微软的安全研究人员发现,DeepSeek 相关人士可能使用 OpenAI 应用程序编程接口 (API),未经授权「窃取」了大量数据。微软已将这一活动通知了 OpenAI。
当日,OpenAI 向外媒透露,它发现了 DeepSeek 使用「蒸馏」技术相关的证据。所谓的「蒸馏」,指通过对更大、更强模型的学习,让小型模型能够在特定任务上以更低的成本取得类似效果。相当于「徒弟」学「师傅」。
针对这种指控,DeepSeek 并未做出回应。
谈到大模型的「蒸馏」,并不等于窃取,其实是行业的一种常见做法。无论是在中国还是美国,AI 实验室普遍会使用 OpenAI 等领先公司的输出数据进行训练。「这意味着它们(新模型)可以免费获得人类反馈优化的成果。我并不惊讶 DeepSeek 可能也在这样做。」加州大学伯克利分校人工智能博士生 Ritwik Gupta 表示。
大模型的「蒸馏」过程 | 图片来源:CSDN
Ritwik Gupta 认为,真正核心的问题在于,「当用户利用数据来创建自己的模型并用于自身目的时,就会存在争议。」
OpenAI 的服务条款规定,用户不能「利用输出内容开发与 OpenAI 竞争的模型」。
「与 OpenAI 竞争的模型」,这个定义有一定的解释空间。例如 DeepSeek-R1 是一个开源模型,面向公众开放,而非自己商用,不一定符合这个定义。
唯一可以确定的是,OpenAI 正在加速封锁自己的出口、甚至谨慎释放自己的技术实力。可以说,它更极致地执行「闭源」。OpenAI 在声明中称,中国公司和其他公司一直在试图「蒸馏」美国领先 AI 公司的模型,OpenAI 将采取一系列反制措施来保护知识产权,包括在发布模型时审慎决定纳入哪些前沿能力。
这不只是公司意志,更是国家意志。OpenAI 称未来与美国政府密切合作至关重要,「这样才能更好地保护最强大的模型,防止对手和竞争对手获取美国技术。」
1 月 28 日,谷歌前首席执行官兼董事长 Eric Schmidt 联合撰写了一篇文章,文章名为《中国的开源人工智能会终结美国在该领域的霸权吗》。Schmidt 表示,DeepSeek 崛起之后,目前全球 AI 领域的权力格局似乎正在围绕两个关键轴转移:一是中美之间的竞争,二是封闭与开源模式的较量。
闭源和开源的互补
这是一个颇具戏剧性的时刻:中国科技公司从过去全球开源的受益者,逐渐变成了开源的反哺者、甚至引领者——从巨头阿里巴巴、初创公司 Minimax、再到此次爆火的 DeepSeek 等,均通过开源向全球开发者免费开放 AI 模型、反哺全球科技生态。
而大多数美国主要科技公司(除了 Meta 之外),仍坚持闭源,并更严格地保密其技术方法。
海外网友甚至调侃 OpenAI 为「CloseAI」。
与此相对的是,DeepSeek 这样的科技公司,通过开源以及与 AMD、华为等厂商的紧密合作,成为了真正「Open」的 AI 公司。当全球无数开发者得以在本地设备上部署运行 R1 模型、并由此衍生出各种应用场景用法,DeepSeek 因此获得了全球开发者的支持、为现在的「爆红出圈」打下了基础。
这证明了开放,才是 AGI 时代最核心的竞争力之一。
即使 OpenAI 现在出来表示「DeepSeek 的研究成果我们更在之前也发现了」,但 DeepSeek 作为率先开源的厂商,仍然收获了全球各地用户与开发者最多的掌声:
将自己走过的路公布出来,让其他人可以少走弯路,快速收敛到最优路径上,开源的意义就在于此。
更重要的是,开源被证明拥有不输于闭源的价值。
此前,由美国构建的闭源模型(如 OpenAI 的 o3 和 Anthropic 的 Claude 3 Opus)一直被视为行业标杆。而开源模型(尤其是中国的开源模型)通常被认为落后几个月。然而,DeepSeek 的 R1 和多模态模型 Janus Pro 彻底彻底改变了这一认知。
当开源模型能在性能上追平闭源对手,这可能会颠覆整个人工智能行业的生态。其低成本优势必将吸引更多开发者,最终可能在这场技术角逐中获胜。
使用容器 App 等方式,已经可以实现完全在手机端侧运行 DeepSeek R1 模型 | 图片来源:X
海外社交媒体上频繁出现这样的「反思」:AGI 时代,依靠着开源与合作,中国同样有机会比美国更先到达 AI 领域的下一个节点。
Eric Schmidt 在文章中呼吁,美国已经拥有世界上最好的闭源模型,为了保持竞争力,还必须支持一个充满活力的开源生态系统的发展。「开源和闭源竞争很可能会找到一种自然的平衡,为不同用户带来一系列不同的产品和价格点。」他说。
OpenAI(以及一众 AI 大厂)和 Deepseek(以及期待更多 AI 新锐)的理想状态,更应该是一幅太极图:闭源对开源、充裕对短缺、外扩对内修、大力对灵巧……看似相克,实则相生。
只有两者互补、而非对立,才有利于人类通向 AGI 之路。因为后者会带来对抗,而前者则能形成合力。
开放,才是未来
在对 DeepSeek 的赞誉之后,大洋彼岸的科技巨头与政府迅速转变态度,核心是在政策层面加速「封锁」。
1 月 29 日,在 DeepSeek「蒸馏」指控之后,白宫新闻秘书卡罗琳·莱维特(Karoline Leavitt)表示,美国官员正在评估 DeepSeek 对美国国家安全的影响。
30 日,Anthropic 的 CEO Dario Amodei 直接发文呼吁美国政府加强对中国的芯片管制。他认为 DeepSeek 的成功并未降低美国芯片算力的价值,相反在通往 AGI 的道路上,未来仍需要数百万块芯片、数百亿美元(至少)。只有继续加剧出口管制,才能保证美国的技术单极「霸权」。
同日,外媒援引消息人士的话称,美国正在考虑对售华芯片实施额外限制的可能性。报道指出,限制措施将涉及英伟达公司的 H20 芯片——这正是 Dario 在文章中建议要限制的芯片,过去由于其训练效率较低,它被允许出口。据消息人士透露,关于限制措施的决定很可能不会很快做出。
DeepSeek 还面临着来自现实物理层面的挑战。据网络安全公司奇安信的专家证实,自 1 月 28 日起,该公司遭遇了来自美国 IP 地址的持续网络攻击,包括 DDoS 攻击和密码破解等多种形式。两天后,攻击暴增百倍。
1 月 28 日,深度求索(DeepSeek)官网显示,其线上服务受到大规模恶意攻击 | 来源 DeepSeek
这些事件背后折射出的深层事实是:随着 DeepSeek 等中国科技公司的崛起,其极大地冲击了国外科技巨头,并动摇了美国长期以来的「科技霸权」。后者似乎想沿用过去的技术限制和封锁手段,维持其主导地位、阻止这一进程。
如果说过去主要封锁的是算力,现在则是同时封锁算力和模型。
但历史可能会证明,试图通过技术封锁来维持优势的做法终将失效。就像过去对算力的限制一样,这种封锁不仅无法阻挡创新,反而催生出了 DeepSeek 这样的巨大创新。
或许在迈向 AGI 的征程中,开放,才是真正的核心竞争力。
更何况,开源模型不是 TikTok 那样依赖互联网的在线服务,它自带「跨越封锁」的属性:如今不仅是高性能主机的用户可以在端侧运行 DeepSeek R1,有开发者甚至研究出了使用本地 App,让蒸馏后 1.5B 大小的 DeepSeek R1 能够完全离线端侧运行在 iPhone 上。这意味着它很难被真正封锁。
「美国的竞争优势长期以来依赖于开放科学、以及产业、学术界和政府的协同合作。我们应该重新拥抱开放科学的可能性,让其再次成为推动美国 AI 发展的动力。」Eric Schmidt 称。
科技从业者的普遍观点是,硅谷科技公司应该追求科技「领导力」而非「霸权」。因为后者必然引发抵抗,产生离心力,难以长期维持。而前者能促进合作,凝聚向心力,推动人类科技进步。硅谷当前确实拥有科技「领导力」,但若一味追求「霸权」地位,反而可能失去这一核心优势,最终作茧自缚被更多具有创新思想的创业者反超。
开放,才是真正的未来,DeepSeek 就是最好的代表。
本文为专栏作者授权创业邦发表,版权归原作者所有。文章系作者个人观点,不代表创业邦立场,转载请联系原作者。如有任何疑问,请联系editor@cyzone.cn。