全球AI产业周报
为你精选过去一周(12.14-12.20)最值得关注的AI新闻和国内外热门AI投融资事件,帮助大家及时了解全球AI市场动向。
一、本周AI热点资讯
国内大事
苹果被曝与腾讯和字节洽谈AI模型合作:腾讯不予置评,字节暂无回应
据路透社报道,三位知情人士称,苹果公司正在与腾讯、字节跳动谈判,希望将这两家公司的人工智能 (AI) 模型整合到在中国市场销售的 iPhone 中。知情人士称,苹果与腾讯、字节跳动的谈判涉及使用后两家公司的 AI 模型,这一讨论尚处于非常早期的阶段。科技网站 The Information 在本月报道称,苹果也曾与百度进行谈判,希望在 iPhone 中整合百度的 AI 模型,但是谈判遇到了挫折,原因是技术问题,其中包括双方在使用 iPhone 用户数据训练 AI 模型方面的争执。12月19日,腾讯方面就此向记者表示:“不予置评。”字节跳动暂无回应。(凤凰网科技、每日经济新闻)
张一鸣进军私募,知情人士称其重心转到大模型和AI
近日,香港证监会网站显示,“Cool River Venture HK Limited”于2024年11月21日获得香港证监会颁发的9号牌,主要办公地址位于中环国际金融中心。这家基金由张一鸣担任董事,唯一股东为Galaxy LLC,持股比例为100%。记者从知情人士处获悉,尽管已经卸任CEO一职,但张一鸣将其工作重心转到大模型和AI(人工智能)的战略和研究。据记者了解,张一鸣不仅亲自负责从竞争对手公司招揽中国AI人才,还多次在内部强调追求“通用人工智能”的目标。字节跳动内部人士称,张一鸣对实现通用人工智能(AGI)极其专注。(澎湃新闻)
极越员工获“n+1”赔偿
极越“原地解散”后员工维权有了最新成果,在有关部门的协调下,将按照“N+1”的标准为员工提供经济补偿。其中,N为司龄起算日至2024年12月20日的服务期限折算,“1”为上个月的基础月薪和津贴(餐补及话补)。截止到离职日尚未享有的年假及调休予以折算。(极目新闻)
可灵1.6模型上线,视频效果越级提升
快手可灵AI宣布基座模型再升级,视频生成推出可灵1.6模型,效果大幅提升。据了解,1.6模型在文本响应度上提升明显,对运动、时序类动作、运镜等文字描述响应更好;动态质量进一步增强:运动更加合理,人物表情更自然;同时,1.6模型画面质量也再次进化:色彩、光影、细节表现均明显提升。数据显示,可灵AI发布半年来,已拥有超过600万用户,累计生成超6500万个视频和超1.75亿张图片。(新京报)
普渡发布首款全人形机器人PUDU D9
12月20日消息,普渡机器人正式发布首款全尺寸双足人形机器人PUDU D9,该机器人高170cm,重65kg,全身关节拥有42自由度,最高关节扭矩达 352Nm。PUDU D9以“可落地具身智能”为目标,将于近期开放预售,目前已通过普渡机器人官网接受意向客户问询。(科创板日报)
闪极AI拍拍镜发布,联合瑞声科技打造耳边音箱
12月19日消息,闪极AI拍拍镜今日发布,零售价1499元;共创版售价999元,春节前限量5000台。业内首次搭载索尼1600万像素、123度超广角装置摄像头模组,与瑞声科技联合打造支持HI- FI级耳边音箱,与紫光展锐合作打造旗舰级低功耗ARM平台,配备6500mAh增程环。此外,还支持头部相机、智能助手、录音笔、AI云盘、AI闪记等功能。其云端AI中心支持数十家大模型接入。(科创板日报)
“通义”应用团队从阿里云分拆,并入阿里智能信息事业群
从多个独立信源处获悉,阿里旗下的AI应用“通义”近期正式从阿里云分拆,并入阿里智能信息事业群。有知情人士称,此次调整包括通义To C方向的产品经理,以及相关的工程团队,一并调整至阿里智能信息事业群。调整后,通义PC及App团队与智能搜索产品“夸克”平级,原有的通义实验室,仍然留在阿里云体系内。此前,阿里旗下的大模型家族“通义”,包括应用层的“通义”App、PC端,均属于阿里云体系。其中,通义大模型家族由达摩院开发——达摩院的主要职能,更偏向基础科学和创新性技术研究;而阿里云又是一个To B业务,也不适合投入进直面To C市场的应用开发和推广中。(金融界)
图森未来发布图生视频大模型“Ruyi”
图森未来正式发布图生视频大模型“Ruyi”,并将Ruyi-Mini-7B版本正式开源,用户可以从huggingface上下载使用。据介绍,Ruyi是一个基于DiT架构的图生视频模型,它由两部分构成:一个Casual VAE模块负责视频数据的压缩和解压,一个Diffusion Transformer负责压缩后的视频生成。模型的总参数量约为7.1B,使用了约200M个视频片段进行训练。Ruyi是图森未来正式发布的第一款“图生视频”模型。(新浪财经)
搭载专属教育大模型,猿辅导发布AI教育硬件小猿学练机彩墨版
12月18日消息,猿辅导集团发布小猿学练机彩墨版。该产品是一款专为低龄儿童设计的教育智能硬件,配备10.3英寸具有护眼功效的彩色墨水屏,搭载基于斑马AI学的分龄启蒙体系,覆盖启蒙教育全场景。据悉,该产品搭载专属教育大模型的阅读场景,可让孩子自主阅读,并在阅读过程中与绘本中的“人物”“电话沟通”。目前,小猿教育专属大模型已在批改、推题、阅读、写作等多个场景落地应用。(创业邦)
字节内部判断AI对话类产品天花板可能不高,提升剪映即梦优先级
从知情人士处获悉,字节管理层判断AI对话类(或称chatbot类)产品可能只是AI产品的“中间态”,长期更理想的产品形式,大概率需要更视觉化的用户体验、更低的用户使用门槛。因此,字节已经提升了即梦的产品优先级,尝试用新的路径打造AI时代的“抖音”。(同花顺)
稚晖君转发智元机器人量产视频
由彭志辉(网名稚晖君)创立的智元机器人发布微博表示“智元开启通用机器人商用量产”。创始人彭志辉表示:两年时间磨一剑,从灵感到蓝图,从样机到量产,智元机器人终于跨越初创沟堑~目标星辰大海,继续砥砺前行。
据悉,彭志辉为科技圈知名KOL,人称“稚晖君”“野生钢铁侠”,原华为天才少年。2015年本科毕业于电子科技大学生命科学与技术学院;2018年研究生毕业于电子科技大学信息与通信工程学院;毕业后就职于OPPO研究院AI实验室担任算法工程师;2020年,加入“华为天才少年计划”,从事昇腾AI芯片和AI算法相关研究工作;2022年12月27日,稚晖君在微博发文回应称已经离开华为,随后创立智元机器人。(新浪财经)
科大讯飞发布S8离线版AI录音笔,支持国密加密离线转
科大讯飞宣布AI录音笔新品S8离线版上市,该录音笔主要针对政府会议、高端商务会议等对信息安全要求极高的场景推出,具备完全隔绝外界网络录音转文字、国密加密、直连信创系统文件导出等功能。(新浪财经)
Kimi发布视觉思考模型k1,“数理化”成绩领先OpenAI o1
12月16日,Kimi发布视觉思考模型k1,在最新版App和Web端上线。在数学、物理、化学等基础科学学科的基准能力测试中,初代k1模型的表现超过了全球标杆模型OpenAI o1、GPT-4o以及Claude3.5Sonnet。(腾讯)
Kimi突然崩了!冲上热搜
12月14日,许多用户反映在尝试使用Kimi时遇到了“网络连接错误”等问题,即使给予了全部权限依然无法解决问题。有些用户表示起初还能短暂恢复,但很快再次陷入无法使用的状态。目前官方尚未发布正式声明解释崩溃的原因。
公开资料显示,Kimi是月之暗面(Moonshot AI)于2023年10月推出的一款智能助手,主要应用场景为专业学术论文的翻译和理解、辅助分析法律问题、快速理解AAPI开发文档等,是全球首个支持输入20万汉字的智能助手产品,目前已启动200万字无损上下文内测。(证券时报)
脉脉高聘:AI岗位占据高薪TOP10半壁江山
根据脉脉高聘发布《2024年度人才迁徙报告》 数据,2024年1-10⽉,在新发岗位平均⽉薪最高的10个岗位中,人工智能相关岗位占据8席。机器学习以47569元⾼居薪资排行榜⾸。从人才紧缺度来看,应届生人才紧缺的岗位覆盖了游戏、教培、互联⽹、⾦融、芯⽚、AI、物流、智能驾驶等多个⾏业。(腾讯)
朱啸虎就“对月暗提起仲裁”一事回应:没有达成一致,仲裁也没有撤
12月15日消息,针对“循环智能老股东对月之暗面提起仲裁”一事,朱啸虎回应:没有达成一致,仲裁也没有撤。此前,2024年11月11日,金沙江创投联合多家循环投资的老股东,在香港对月之暗面杨植麟及联合创始人兼CTO张宇韬提起仲裁,认为月之暗面从循环智能分拆损害了循环智能及其股东利益,要求补偿近1亿美元金额。
此后,朱啸虎连发两条朋友圈,并接受多家媒体采访,称愿意豁免杨植麟及月之暗面,但矛头直指张予彤“隐瞒利益冲突”,违反董事对公司的信义义务,基金管理人对LP投资人的受托责任。杨植麟后来也发文称,承认张予彤为月之暗面联合创始人,认为张予彤加入月之暗面与其他投资机构放弃投资月之暗面、月之暗面从循环智能分拆并获得授权手续为相互独立的事件。朱啸虎曾表达,12月15日月暗若拿不到循环老股东的豁免或被起诉,月暗股东将要求月暗降低估值10%。(财联社)
阶跃星辰推出国内首个千亿参数端到端语音大模型“Step-1o”
12月13日,阶跃星辰宣布推出Step-1o千亿参数端到端语音大模型,据称是“国内首个千亿参数端到端语音大模型”。据阶跃星辰介绍,传统的语音模型采用级联方案,用户输入的语音信息需要先转化为文本,再二次转化成语音输出,这个过程不仅会降低传输效率、更会在过程中折损掉包括情绪在内的信息,导致语音模型时延长反应慢、回答质量和智能水平不足、情感表达空洞刻板的缺陷。但端到端的语音方案,可以实现语音理解和生成的一体化,提升模型智商和情商的上限。(IT之家)
腾讯微信正式发布多模态大模型POINTS 1.5
12 月 14 日,距离POINT1.0的发布已经过去两个月的时间,腾讯宣布推出 POINTS1.5。POINTS1.5 仍然沿用了POINTS1.0中使用的经典的LLaVA架构,由一个vision encoder,一个projector和一个大语言模型组成。据官方介绍,这一代POINTS模型,不仅兼顾了POINTS1.0中所坚持的效率优先的思想,同时极大了增强了模型的性能。腾讯表示,POINTS1.5-7B位居全球10B以下开源模型的榜首,超越诸如 Qwen2-VL, InternVL2和MiniCPM-V-2.5等业界领先的模型。实际应用方面,POINTS1.5 在复杂场景的OCR,推理能力,关键信息提取,Latex公式提取,数学,图片翻译,物体识别等几个方面中都有不错的表现。(IT之家)
微信:将持续对“利用AI仿冒知名人士进行营销宣传”等违规行为增加打击力度
12月15日消息,“微信珊瑚安全”发布公告称,近期有媒体报道网络存在利用AI技术仿冒名人进行不当营销的现象。结合用户举报、日常巡查等线索,微信从速从严打击了一批利用AI仿冒知名人士进行不当营销、恶意博取流量的违规行为,并针对相关情况开展专项治理。截至目前,累计处置内容532条,关闭账号209个。下一步,微信将持续对“利用AI仿冒知名人士进行营销宣传”等违规行为增加打击力度。(财联社)
OpenAI前资深算法负责人江旭创建亮源新创,打造具身智能陪伴机器人
据悉,OpenAI前资深算法负责人江旭已创建机器人公司“亮源新创”(Light Robotics),入局具身智能陪伴机器人领域。江旭曾在OpenAI担任资深算法负责人,是ChatGPT最重要训练算法RLHF的发明人之一,曾参与开发理解和执行人类指令的模型InstructGPT,以及强化学习方法RLHF等项目。公开资料显示,江旭于2023年离开OpenAI,今年8月创建亮源新创。一位知情人士称,亮源新创主要打造To C的具身智能陪伴机器人,在深圳、新加坡设有办公室,正在招聘员工。(新浪财经)
海外大事
OpenAI宣布桌面版ChatGPT推出应用协作功能
12月20日消息,OpenAI当地时间12月19日宣布,桌面版ChatGPT推出“与应用协作”(Work With Apps)功能,支持原生应用程序自动化协作。除VS Code、 Xcode等编程应用程序外,桌面版ChatGPT还集成了苹果Notes、Notion和Quip等办公应用,高级语音模式也可与这些应用程序协同工作。OpenAI表示,新功能已上线macOS版本ChatGPT,适用于Plus、Pro、团队、企业及教育用户,并计划明年开放给Windows版本和免费用户。(财联社)
OpenAI约400名员工迎股票套现机会,每人最多1000万美元
约400名OpenAI现任和前任员工将获得数百万美元的现金,这要归功于这家旧金山公司与日本软银集团安排的一笔特别股票出售。据知情人士透露,收购要约允许部分OpenAI员工和前员工以每股210美元的价格将所持的股票出售给软银。消息人士称,软银计划从符合条件的OpenAI股东手中收购至多16亿美元的股票,后者须在两年多前获得限制性股票方能参与。符合条件的OpenAI股东须在12月24日之前作出决定。每个参与者将被允许出售价值1000万美元的既得股票。(新浪财经)
OpenAI开放满血o1模型API,成本下降60%
18日凌晨,OpenAI开启了第9天技术分享直播,正式发布了o1模型的API,并且对实时API进行大升级,支持WebRTC。其中,o1模型的API与之前的预览版本相比,思考成本降低了60%,并且附带高级视觉功能;GPT-4o的音频成本降低60%,而mini版本价格更是暴降了10倍。同时OpenAI还发布了全新的偏好微调方法,通过直接偏好优化算法可以让大模型更好地掌握用户的偏好风格。(AIGC开放社区)
ChatGPT搜索大更新,新增实时搜索和高级语音
OpenAl开启第八天技术分享直播,对ChatGPT搜索功能进行大量更新。新增的功能包括,实时搜索,OpenAl对搜索的算法进行了深度优化,可在用户提出问题后获取实时内容(分钟级别),包括股票、新闻等;高级语音,在高级语音模式下,用户可以与ChatGPT进行更自然的多轮搜索对话,更像是-位语音搜索管家;移动端优化,用户可以在安卓:OS、平板等移动端更好地使用搜索功能,效率提升40%以上。地图集成,现在ChatGPT集成了全新的地图功能,用户可以直接在搜索结果中查看周边地理位置信息,进行路线规划和地点探索。这个功能估计是要朝着商业模式发展,以后会与餐厅、商城一类的进行商务合作。(新浪财经)
26岁前OpenAI研究员自杀,曾质疑公司ChatGPT版权问题
据报道,26岁的前OpenAI研究员Suchir Balaji近日被发现死于其旧金山的公寓内。Suchir于今年早些时候离开了OpenAI,并公开提出担忧,称该公司在开发ChatGPT 聊天机器人时涉嫌违反美国版权法。旧金山首席法医办公室执行主任Sewell表示:“已确定死亡方式为自杀。”
Balaji是一名印度裔美国人,曾在加州大学伯克利分校学习计算机科学,毕业后加入了OpenAI,参与过WebGPT的研发,后来又加入GPT-4的预训练团队,o1的推理团队以及ChatGPT的后训练团队。在OpenAI工作了四年之后,Balaji突然辞职,并强调他认为人工智能这项技术给社会带来的危害将大于益处。
10月,美国《纽约时报》专门刊登了Balaji的担忧,其中写道,Balaji认为ChatGPT和其他类似的聊天机器人会破坏那些创建数字数据和内容的个人或组织的商业未来,这些数据和内容已被广泛用于训练人工智能。在Balaji被发现死亡的前一天,一份法庭文件将他列为针对OpenAI的版权讼案的被告之一。OpenAI目前与多家出版商、作家和艺术家因版权问题存在法律纠纷。(IT之家)
OpenAI前首席科学家苏茨克维:具有推理能力的人工智能将难以预测
OpenAI联合创始人、前首席科学家伊尔亚·苏茨克维当地时间12月13日在温哥华的神经信息处理系统大会(NeurIPS)上表示,堆算力的“预训练”时代毫无疑问将会结束,未来的人工智能将像人类一样推理问题。“推理越多,事情就越不可预测,”他说。(东方财富网)
OpenAI发长文控诉马斯克
当地时间周五,OpenAI公布了多份马斯克与OpenAI数位创始人之间的邮件和聊天记录,通过一系列详实证据驳斥了马斯克的所有指控。在一篇题为“埃隆·马斯克想要一个营利性的OpenAI”的博文中,这家初创公司声称,在2017年,马斯克不仅想要OpenAI转变为营利性公司,而且实际上创造了一个营利性的公司结构。OpenAI指出,当马斯克没有获得OpenAI的多数股权和控制权时,他离开了这家公司,并声称OpenAI会走向失败。(和讯网)
消息称马斯克与台积电董事长魏哲家见面,透露机器人是特斯拉未来的重心
据报道,特斯拉CEO埃隆・马斯克上周在美国会见了台积电董事长魏哲家。魏哲家称,“全世界最有钱的企业家告诉我,多功能机器人是他努力的方向,而不是汽车,他最担心是没有人供给芯片。”魏哲家强调,“听清楚,多功能的机器人,是他要努力的方向,而不是汽车。”(财联社)
马斯克旗下xAI:开始向X平台上的所有用户免费推出新版Grok-2模型
马斯克旗下xAI:新版Grok-2模型现已免费向所有人开放,新的AI助手速度更快、更清晰,并且包含所有新图像生成功能。现在可在社交媒体X平台上免费使用。(同花顺财经)
谷歌DeepMind推出Veo 2和Imagen 3 革新AI视频图像生成
谷歌DeepMind实验室近日推出Veo 2视频生成模型和Imagen 3图像模型,旨在提升视频和图像创作的真实感和个性化体验,挑战OpenAI在AI生成领域的领先地位。Veo 2能生成高质量视频,支持多样化主题和风格,而Imagen 3在图像构图和细节准确性方面得到增强。此外,谷歌还推出了Whisk工具,结合Imagen 3和Gemini能力,提供创意设计服务。(一财网)
微软出招,新模型数学超GPT-4o编程胜Llama3.3,训练新范式midtraining引热议
微软推出最新小模型Phi-4。参数量仅14B,MMLU性能就和Llama 3.3/ Qwen2.5等70B级别大模型坐一桌。数学能力上,Phi-4在美国数学竞赛AMC 10/12上超过了GPT-4o等一众大模型,分数冲上90。编程能力也是开源模型一流,超过了70B的Llama 3.3和72B的Qwen 2.5。微软在技术报告中还提出了一个新的训练范式——midtraining。(新浪财经)
二、AI投融资概览
根据睿兽分析监测数据,本周全球披露的AI融资事件17个, 相比上周减少4个, 其中已披露融资金额的事件17个, 总融资规模为810.13亿元人民币, 平均融资金额为47.65亿元人民币。
阶段分布
从本周全球已披露获投AI企业的阶段分布来看,早期11个、成长期2个、后期3个。
本周全球AI投融资事件阶段分布图
地区分布
从本周国内披露获投AI企业的地区分布来看,主要集中在北京、广东、上海、天津、江苏,其中北京披露5起,广东披露3起,上海披露2起,天津、江苏均为披露1起。
本周国内AI投融资事件地区分布图
本周国内AI融资/IPO事件
本周国内AI领域已披露融资总额为37.51亿元人民币。其中,融资金额最高的公司为AI知识智能技术开发商智谱,宣布完成新一轮 30 亿人民币融资。
智谱AI是一家AI知识智能技术开发商,由清华大学计算机系知识工程实验室的技术成果转化而来。智谱AI致力于打造新一代认知智能大模型,专注于做大模型的中国创新。公司合作研发了中英双语千亿级超大规模预训练模型GLM-130B,并基于此推出对话模型ChatGLM,开源单卡版模型ChatGLM-6B。同时,团队还打造了AIGC模型及产品矩阵,包括AI提效助手智谱清言、高效率代码模型CodeGeeX、多模态理解模型CogVLM和文生图模型CogView等。
四、本周海外AI融资事件
本周海外AI领域已披露融资总额为772.62亿元人民币。其中,融资金额最高的公司为AI大数据软件提供商Databricks,宣布完成100亿美元I+轮融资,估值达到620亿美元。
Databricks是一家基于云计算Spark的大数据软件提供商,提供用于数据集成、数据清洗、数据管理以及其他服务的基于Spark的云服务。Databricks的Spark处理引擎甚至比Apache Hadoop的处理速度更快。