#训练# - 标签聚合 - 创业邦

# 训练 #

文章32阅读47.4K关注0

关注

Karpathy「疯狂之作」：100美元、4小时，就能训练你自己的「小型GPT」

AI传奇人物、前特斯拉AI总监Karpathy重磅推出全新开源项目「nanochat」，以不到8000行代码复现ChatGPT全流程，只需一台GPU、约4小时、成本仅百美元。该项目在GitHub上线不到12小时即获4.2k星标！

训练项目代码推理

10-14

Gemini灵魂人物加盟xAI，马斯克亲自夹道欢迎！

“终于过上了「卡」如土的好日子”

谷歌马斯克训练能力算力

09-27

又一家AI公司，惹怒好莱坞

AI“免费午餐”时代终结。

模型训练 AI

09-18

刚刚，DeepSeek登上Nature封面！梁文锋带队回应质疑，R1训练真29.4万美金

DeepSeek荣登Nature封面，实至名归！今年1月，梁文锋带队R1新作，开创了AI推理新范式——纯粹RL就能激发LLM无限推理能力。Nature还特发一篇评论文章，对其大加赞赏。

09-18

16岁创业，22岁做成百亿独角兽！3位高中同学帮大厂训AI年入1亿美金

Meta豪掷143亿收购Scale AI，意外成就了3名22岁青年的创业神话！他们靠着为OpenAI等顶级AI实验室输送模型专家训练师，干出百亿独角兽Mercor，年入1亿美金。目前，Mercor在《福布斯》Cloud 100 榜单中排名第89位。

数据标注公司收购训练创始人

09-08

「DeepSeek二代」来袭！数学暴击o3，英伟达开源LLM登顶

基于Qwen2.5架构，采用DeepSeek-R1-0528生成数据，英伟达推出的OpenReasoning-Nemotron模型，以超强推理能力突破数学、科学、代码任务，在多个基准测试中创下新纪录！数学上，更是超越了o3!

07-21

中国，正在批量制造AI印钞机

AI应用的爆发，会是AI渗透到用户端，最终变得普惠的大势所趋。

AI 模型训练

03-21

o1/o3后训练掌门人出走创业，OpenAI鼎力支持押注AI材料！曾师从Bengio

OpenAI后训练团队负责人William Fedus正式离职，将自创业投身于AI材料领域。没想到，这一创业项目竟获老东家注资支持。

训练模型科技

03-18

DeepSeek们的成本，是怎么计算的？

大模型混战，一边卷能力，一边卷“成本”。

02-19

成本不到150元！李飞飞等26分钟训出个推理模型，媲美o1和R1，秘诀：用蒸馏

成本不到150元，训练出一个媲美DeepSeek-R1和OpenAI o1的推理模型？！

团队模型训练

02-08

DeepSeek，能颠覆AI竞赛规则吗？

一家中国大模型公司，如何另辟蹊径，改变牌局？

模型训练科技公司

02-01

硅谷掀桌！DeepSeek遭OpenAI和Anthropic围剿，美国网友都看不下去了

OpenAI拒绝进一步置评

模型训练科技

01-30

DeepSeek新模型大揭秘，为何它能震动全球AI圈

真正的理解来自于主动建构，而不是被动接受。

模型训练强化学习

01-23

GPT-5、 Opus 3.5为何迟迟不发？新猜想：已诞生，被蒸馏成小模型来卖

可能没有GPT-5这个型号了。

模型性能训练

01-17

大模型“六小虎”的2024：大厂强势，蹊径难寻

以变革应对变局，以远见超越未见。四木相对论、大象新闻、大象财富联合腾讯新闻、腾讯财经、腾讯科技推出2024年终策划《变局之下》，回望2024、展望2025，让洞见穿越时间，向未来寻求确定。

模型大厂训练

2024-12-30

26岁OpenAI举报人疑自杀！死前揭ChatGPT训练黑幕

26岁的OpenAI吹哨人，在发出公开指控不到三个月，被发现死在自己的公寓中。法医认定，死因为自杀。那么，他在死前两个月发表的一篇博文中，都说了什么？

合理使用训练 OpenAI 科技

2024-12-15

Ilya向全世界宣布：预训练结束了！全球AI数据耗尽，超级智能才是未来

全球顶会NeurIPS 2024中，Ilya登场演讲，向全世界宣告：预训练结束了！数据如同化石燃料般难以再生，未来，AI的发展方向就是具备自我意识的超级智能。

神经网络训练智能体深度学习科技

2024-12-15

Scaling Law或将终结？哈佛MIT预警：低精度量化已无路可走，重磅研究掀翻AI圈

哈佛斯坦福MIT等机构首次提出「精度感知」scaling law，揭示了精度、参数规模、数据量之间的统一关系。数据量增加，模型对量化精度要求随之提高，这预示着AI领域低精度加速的时代即将结束！

模型训练研究

2024-11-18

扩散模型失宠？端侧非自回归图像生成基础模型Meissonic登场，超越SDXL

Meissonic发布，专为消费级显卡设计，高效生成1024×1024图像。

图像生成训练

2024-11-13

硅谷深思：GPT应用迟未爆发，大模型泡沫根源初探

大模型行业泡沫正在显现。

模型训练数据

2024-10-11

查看更多内容

关于我们

订阅服务

特别推荐

法律相关

Copyright 2007-2023 cyzone.cn All rights reserved 京ICP证070362号京ICP备08103950-1号京ICP备08103950-9号京ICP备08103950-10号新出发京零字第朝140005号

爱奇清科（北京）信息科技有限公司地址：北京市朝阳区丽泽西街东湖国际中心A座7层 | 网络文化经营许可证（京网文[2018]2153-213号）

违法和不良信息举报电话：010-53391121 举报邮箱：db@cyzone.cn

京公网安备 11010502035114号

营业执照出版物经营许可证

反馈

联系我们

推荐订阅