「硅谷周报」是创业邦推出的系列栏目,旨在为科技领域创业者和投资人精选硅谷科技要闻,投融资消息等,记录AGI的时代切面。
整理丨 刘杨楠
本周(2024.12.09-12.15)硅谷科技要闻包括:OpenAI继续“十二连更”,推出Sora、Canvas、GPT-4o、Project,ChatGPT将与苹果生态全面整合;Meta阻止OpenAI转为营利性组织;谷歌相继发布量子芯片、Gemini 2.0;苹果发布视频生成模型;英伟达被反垄断调查,股价暴跌;前ChatGPT语音创始人创办AI语音新公司等。
大公司
Meta要求美国政府阻止OpenAI转为营利性组织
Meta要求加州总检察长Rob Bonta阻止OpenAI从非营利组织向营利性实体的转型计划。
在本周发送给Bonta办公室的一封信中,Meta表示OpenAI“不应被允许藐视法律,拿走并重新挪用其作为慈善机构建立的资产,并将其用于潜在的巨额私利”。
在致政府的信中,Meta认为OpenAI的“行为可能对硅谷产生重大影响”并且“代表了技术初创企业的范式转变”,因为它诱使“投资者以非营利形式创办组织,收集数亿美元的免税捐款来支持研发,然后在其技术具有商业可行性后转为营利性组织”。
对此,OpenAI董事会主席Bret Taylor回应道,该公司的非营利董事会“专注于履行我们的受托义务,确保公司能够继续推进其使命,即确保 AGI 造福全人类。”
微软推出最新小模型Phi-4
12月13日,微软发布最新小模型Phi-4。
Phi-4参数规模14B,其竞争对手包括GPT-4o mini、Gemini 2.0 Flash和Claude 3.5 Haiku等其他小型模型。据微软介绍,Phi-4在多个领域相较于前一代模型均有所改进,尤其在解决数学问题方面表现突出,这主要得益于训练数据质量的提升。
目前,Phi-4的可用性相对有限,仅限于在微软新推出的Azure AI Foundry开发平台上使用,且仅限于研究目的,需遵循微软的研究许可协议。
谷歌新一代大模型Gemini 2.0突然登场,谷歌CEO皮柴亲自官宣
12月12日凌晨,谷歌CEO皮柴发布新一代大模型Gemini 2.0。这是谷歌迄今为止功能最强大的模型。
目前,Gemini 2.0 Flash实验模型将向所有Gemini用户开放。
Geimini 2.0 Flash在关键基准测试中比1.5 Pro更快,速度是1.5 Pro的两倍。除了支持图像、视频和音频等多模态输入外,2.0 Flash还支持多模态输出,例如与文本混合的原生生成的图像和可操纵的文本转语音 (TTS) 多语言音频。它还可以原生调用Google搜索、代码执行以及第三方用户定义函数等工具。
同时,谷歌还推出一项名为Deep Research的新功能,它使用高级推理和长上下文功能充当研究助手,探索复杂主题并代替用户编写报告。这项功能在Gemini Advanced中可用。
Gemini 2.0 Flash现已作为实验模型通过Google AI Studio和Vertex AI中的Gemini API向开发者提供,所有开发者均可使用多模式输入和文本输出,早期合作伙伴可使用文本转语音和原生图像生成功能。2025年1月将全面上市,同时将推出更多模型尺寸。
谷歌发布量子芯片,比特币大跌
当地时间12月9日,在OpenAI发布Sora后,谷歌发布新的量子计算芯片Willow。
Willow拥有105个物理量子比特,可通过规模扩展来降低错误率 ,5分钟就能完成超级计算机10^25年才能完成的计算。
通过在Willow中创建逻辑量子比特,谷歌团队证明,一个逻辑量子比特的大小每连续增加1次,错误率就会降低一半。
谷歌量子计算部门首席运营官Charina Chou指出,这项成就意味着到2030年结束时,量子计算机就可以取得即便是最强大的超级计算机都无法完成的科学发现。”
但最快受到影响的是比特币市场。
12月10日,比特币从10万美元一度跌到94150美元,最大跌幅6.25%。Coinglass数据显示,Willow发布后24小时内共有58.3万人爆仓。据悉,有观点认为,谷歌Willow芯片发布后,可能导致算力猛增,挖矿成本大幅下降,最终所有加密货币都可能被破解。
Sora之后,苹果也发布视频生成模型了
OpenAI正式发布Sora一天后,在一篇由多位作者署名的论文《STIV: Scalable Text and Image Conditioned Video Generation》中,苹果正式公布多模态大模型研究成果。
该研究提出STIV模型。STIV是一个参数规模8.7B的视频生成模型,支持文本、图像输入,可实现文本到视频(T2V)和文本图像到视频(TI2V)任务的统一处理,并通过JIT-CFG显著提升生成质量。模型易于训练且适配性强,可扩展至视频预测、帧插值和长视频生成等任务。实验结果展示了STIV在VBench基准数据集上的优势,包括详细的消融实验和对比分析。
该研究不仅提升了视频生成质量,还为视频生成模型在未来多种应用场景中的推广奠定了坚实基础。
英伟达被反垄断审查,股价暴跌
12月9日,国家市场监督管理总局发布消息称,因英伟达公司涉嫌违反《中华人民共和国反垄断法》及《市场监管总局关于附加限制性条件批准英伟达公司收购迈络思科技有限公司股权案反垄断审查决定的公告》,市场监管总局依法对英伟达公司开展立案调查。
12月10日,英伟达对通过媒体回应,称“英伟达凭借实力取胜,这反映在我们的基准测试结果和对客户的价值上,客户可以选择任何最适合他们的解决方案。我们努力在每个地区提供最好的产品,并在我们开展业务的任何地方履行我们的承诺。我们很乐意回答监管机构对我们业务的任何问题。”
反垄断消息爆出后,英伟达市值一夜缩水近千亿美元。
独角兽
OpenAI十二天连更第7天:上线Project功能
12月14日,OpenAI推出名为“Projects In ChatGPT”的新功能,并称其为今年发布的最重要的AI功能之一。
Projects将ChatGPT中的聊天记录、文件和自定义指令集中在一个地方,便于用户管理文件。
在Projects中,用户可以使用ChatGPT的任何功能,例如SearchGPT、Canvas和编程。所有类似的工作都可以放到一起来集中处理,包括上传的文件、过去的对话、自定义的指令等等。
Projects功能即日起将向Plus、Pro和Teams用户开放。
此前,Claude已推出类似功能。
OpenAI十二天连更第6天:GPT-4o全面开放
今年5月14日的春季发布会上,OpenAI首次正式介绍了GPT-4o,并现场演示了其原生多模态能力。用户不仅能够与AI进行实时对话,AI还可以实时理解用户的动作和环境。
此次直播发布了GPT-4o的三项新功能,支持实时视频通话;实时理解屏幕以及圣诞老人限定语音。
从12月13日起,最新的移动应用将逐步向所有Team用户及大部分Pro和Plus订阅者推出高级语音视觉功能。对于欧洲的Pro和Plus用户,OpenAI将尽快提供这项服务。至于企业用户和教育用户,他们将在明年年初获得访问权限。
OpenAI十二天连更第5天:ChatGPT与Apple生态全面整合
ChatGPT将无缝接入iPhone、iPad和Mac用户的日常场景,并与Siri和 Apple Intelligence展开智能协同,为苹果设备带来全新体验。
苹果官方也发文确认了iOS 18.2,iPadOS 18.2和macOS Sequoia 15.2三个新系统版本的发布。
OpenAI表示,用户现在可以直接在Apple的多款设备中直接调用ChatGPT,包括iPhone、iPad和Mac。这种无缝集成消除了以往使用多步流程启动ChatGPT的繁琐步骤,用户只需通过简单的操作即可开始对话。
此外,ChatGPT支持多设备协作。用户可以在iPhone上提出问题,获得初步回答后切换到Mac继续分析,并在 iPad 上保存或编辑结果。这种无缝体验体现了 OpenAI 和 Apple 在用户体验设计上的深厚功力。
OpenAI十二天连更第4天:全面开放Canvas,支持运行python代码
12月11日,OpenAI面向所有ChatGPT用户开放使用。Canvas于10月发布,之前仅向付费的ChatGPT Plus、Teams、Edu和Enterprise用户提供。
最新的Canvas采用分屏设计,将ChatGPT的传统界面(顶部是对话,底部是文本输入框)转换为左侧边栏,并在聊天会话屏幕的右侧,为用户正在处理的内容(例如应用程序或文本文档的代码块)添加了新的空间。
Canvas将集成到GPT-4o中,无需在模型选择器上使用Canvas切换到GPT-4o。Canvas将自动打开以显示某些提示或粘贴的文本。它仅在ChatGPT的Web版本或Windows应用程序上可用。
Canvas还可运行Python代码、支持更多文本粘贴并可在自定义GPT中启动。
对于创建自定义GPT的用户,Canvas将默认集成,但用户仍然可以定义Canvas何时以及是否在他们创建的助手上打开提示的参数。
但对于现有的自定义GPT,OpenAI并未将Canvas设为默认,以避免破坏现有的工作方式。用户可以通过自定义GPT的设置将Canvas作为一项功能添加到他们的GPT中。
OpenAI十二天连更第3天:Sora终于来了!
12月10日,OpenAI正式推出Sora。
睿兽分析
,赞10
同时,OpenAI开发了Sora的新版本——Sora Turbo,比今年2月预览的模型快得多。我们今天将其作为Sora.com上的独立产品发布给ChatGPT Plus和Pro用户。
用户可以生成分辨率高达1080p、最长20秒、宽屏、垂直或方形的视频;可以自带素材进行扩展、混音和混合,或者从文本生成全新的内容。
OpenAI开发了新的界面,以便用户更轻松地使用文本、图像和视频提示 Sora。故事板工具可让用户精确指定每一帧的输入。
Sora是Plus帐户的一部分,无需额外付费。您每月最多可以生成50个480p分辨率的视频,或更少的720p分辨率的视频。
X的Grok助手推出图像生成器Aurora
X的Grok助手中推出了一款新的图像生成器——Aurora。
Aurora的设计初衷是为了用AI创造照片般真实的图像。在移动应用和网页的Grok标签中,用户可以访问Aurora进行图像生成。与X在十月份推出的首款图像生成器类似,Aurora的使用没有过多的限制,包括一些可能涉及版权的图片生成。
Aurora的发布正值X将Grok功能对所有用户免费开放之际,目前的生成效果还有一些瑕疵,比如对于一些细节的刻画,未来应该还会继续优化,同时生成的次数有所限制,在大模型后期优化之后要看官方如何运营
投融资
Liquid AI完成由AMD领投的2.5亿美元早期融资
12月13日,生成人工智能初创公司Liquid AI宣布已完成由AMD领投的2.5亿美元早期融资。
Liquid AI开发了Liquid Foundation模型 (LFM),据称与OpenAI、AWS 和Google Cloud提供的传统基于云的产品相比,这些模型更小、更高效,适合企业使用。
这笔资金将帮助Liquid AI扩大基础设施规模,并为消费电子、生物技术、电信、金融服务和电子商务等行业开发定制的LFM。
OpenAI数据中心提供商Crusoe完成6亿美元D轮融资,估值28亿美元
12月13日,Crusoe宣布完成6亿美元D轮融资,Founders Fund领投,其他投资者包括富达、Long Journey Ventures、阿联酋主权财富基金 Mubadala、Nvidia、Ribbit Capital 和 Valor Equity Partners。
Crusoe成立于2018年,致力于利用大规模清洁能源建设计算和人工智能基础设施。
公司推出了一个新的云平台Crusoe Cloud,旨在帮助开发人员和数据科学家有效管理人工智能和机器学习工作负载。
Crusoe主要开发AI数据中心,并通过云服务出租Nvidia GPU,该服务从12月13日起正式上线。
据The Information报道,该公司正在德克萨斯州阿比林开发一个大型数据中心园区,该园区将为Oracle和OpenAI提供算力。
AI语言学习初创公司Speak完成7800万美元C轮融资,投后估值10亿美元
AI语言学习领域迎来第一家独角兽。
Speak宣布完成7800万美金C轮融资,由Accel领投,OpenAI Startup Fund、Khosla Ventures和Y Combinator等跟投。本轮投后估值10亿美金。半年前,Speak刚完成一轮2000万美元的融资,估值5亿美元,过去半年内估值翻倍。目前,Speak总融资额达1.62亿美元。
Speak成立于2016年,是美国一家由人工智能驱动的英语学习平台。创始人Connor Zwick,2015年毕业于哈佛大学。Speak主打口语学习,用户可以通过一系列交互式口语体验练习英语会话。在AI Tutor的引导下,让用户像和真人教师对话那样不断进行口语练习,并对发音、语法和词汇等方面给予实时反馈。
睿兽分析
,赞9
目前,Speak以to C为主,今年开始拓展to B业务。官方披露数据显示,今年Speak创建了超过2500万个个性化课程。到目前为止,用户已经用Speak进行超过10亿句练习。
Speak企业级业务Speak for Business可以练习特定的商务对话,例如与供应商和客户的讨论。目前,Speak for Business拥有超过200个客户,员工采用率为85%。
芯片公司Ayar Labs Inc.完成1.55亿美元融资
据彭博社报道,Ayar Labs Inc.专注于利用光在芯片之间传输数据。
近日,Ayar Labs Inc.宣布完成1.55亿美元融资,投资方包括Advent Global Opportunities、Light Street Capital、英伟达、AMD Ventures 和Intel Capital,估值超10亿美元。
Ayar Labs用基于光子的解决方案取代传统的电气互连,以解决芯片计算功耗、发热和数据传输速度的问题。Ayar Labs联合创始人兼首席执行官马克·韦德 (Mark Wade) 表示,客户已经在试用Ayar Labs的芯片,他的目标是在2026年中期使其获得大规模生产的资格。他说,这轮融资所筹集的资金将用于扩大生产。
Lumen Orbit完成1100万美元种子轮融资,估值4000万美元
Lumen Orbit成立于2024年1月,是一家致力于在太空建立数据中心的初创公司。
近日,Lumen Orbit完成1100万美元种子轮融资,估值4000万美元。此次交易由NFX牵头,NFX 普通合伙人 Morgan Beller 将加入公司董事会 Fuse.VC、Soma Capital 以及 Andreessen Horowitz 和 Sequoia均参与投资。今年3月,Lumen Orbit完成240万美元种子前融资。
Lumen Orbit计划在在极低地球轨道部署约300颗卫星。第一颗卫星将是一颗60公斤(132 磅)的演示卫星,预计将于2025年5月作为SpaceX Falcon 9火箭的共载有效载荷发射。
“我们创办 Lumen 的使命是发射一组轨道数据中心,用于太空边缘处理,”首席工程师Adi Oltean表示,“本质上,其他卫星会将他们收集的原始数据发送给我们的卫星。使用我们的机载 GPU,我们将运行他们选择的 AI 模型来提取见解,然后我们将为他们下行传输。这将节省下行大量原始数据的带宽以及相关的成本和延迟。”
英国AI云服务提供商Nscale完成1.15亿美元A轮融资
12月9日,英国AI云服务提供商Nscale完成1.15亿美元A轮融资。投资方包括BlueSky Capital、Florence Capital、Kestrel0x1和Sandton Capital Partners。此轮融资将用于进一步拓展Nscale的业务范围和提升服务质量。Nscale此前曾于2023年12月筹集了3000万美元的种子资金。
Nscale于2024年5月正式推出基于AMD Instinct MI300X GPU的云服务。此外,Nscale还提供AMD MI250 GPU以及Nvidia的 A100、H100和V100 GPU。该公司表示,其云服务可用于AI训练、渲染和科学计算等任务。
Nscale在挪威Glomfjord的一个数据中心运营着一个60MW的数据中心。
该公司声称,其已将其位于欧洲和北美的绿地数据中心规模从 300MW扩展到1.3GW,并计划于2025年开发120MW。
前ChatGPT语音负责人创办AI语音新公司,4000万美元种子轮融资
AI音频公司WaveForms AI于12月9日宣布完成4000万美元种子轮基金,由Andreessen Horowitz领投。
据TechCrunch报道,WaveForms AI由前ChatGPT语音负责人Alexis Conneau创办。WaveForms AI正在开发人工智能音频软件,捕捉情感线索,让人与机器更好的对话,目标是在2025年发布能与OpenAI和Google竞争的AI音频产品。