资讯
邦连接
创业服务
创业邦学园
在线课堂
天使基金
优企酷
邦出海
产业创新
城市创新
大企业创新
创投联盟
研究咨询
睿兽分析
活动
榜单
年度榜单
实时榜单
搜索
公众号
登录 | 注册
个人中心
工作台
会员中心
我的邦积分
我的订阅
我的消息
# 训练 #
文章
24
阅读
29.5K
关注
0
关注
DeepSeek们的成本,是怎么计算的?
大模型混战,一边卷能力,一边卷“成本”。
模型
训练
02-19
成本不到150元!李飞飞等26分钟训出个推理模型,媲美o1和R1,秘诀:用蒸馏
成本不到150元,训练出一个媲美DeepSeek-R1和OpenAI o1的推理模型?!
团队
模型
训练
02-08
DeepSeek,能颠覆AI竞赛规则吗?
一家中国大模型公司,如何另辟蹊径,改变牌局?
模型
训练
科技公司
02-01
硅谷掀桌!DeepSeek遭OpenAI和Anthropic围剿,美国网友都看不下去了
OpenAI拒绝进一步置评
模型
训练
科技
01-30
DeepSeek新模型大揭秘,为何它能震动全球AI圈
真正的理解来自于主动建构,而不是被动接受。
模型
训练
强化学习
01-23
GPT-5、 Opus 3.5为何迟迟不发?新猜想:已诞生,被蒸馏成小模型来卖
可能没有GPT-5这个型号了。
模型
性能
训练
01-17
大模型“六小虎”的2024:大厂强势,蹊径难寻
以变革应对变局,以远见超越未见。四木相对论 、大象新闻、大象财富联合腾讯新闻、腾讯财经、腾讯科技推出2024年终策划《变局之下》,回望2024、展望2025,让洞见穿越时间,向未来寻求确定。
模型
大厂
训练
2024-12-30
26岁OpenAI举报人疑自杀!死前揭ChatGPT训练黑幕
26岁的OpenAI吹哨人,在发出公开指控不到三个月,被发现死在自己的公寓中。法医认定,死因为自杀。那么,他在死前两个月发表的一篇博文中,都说了什么?
合理使用
训练
OpenAI
科技
2024-12-15
Ilya向全世界宣布:预训练结束了!全球AI数据耗尽,超级智能才是未来
全球顶会NeurIPS 2024中,Ilya登场演讲,向全世界宣告:预训练结束了!数据如同化石燃料般难以再生,未来,AI的发展方向就是具备自我意识的超级智能。
神经网络
训练
智能体
深度学习
科技
2024-12-15
Scaling Law或将终结?哈佛MIT预警:低精度量化已无路可走,重磅研究掀翻AI圈
哈佛斯坦福MIT等机构首次提出「精度感知」scaling law,揭示了精度、参数规模、数据量之间的统一关系。数据量增加,模型对量化精度要求随之提高,这预示着AI领域低精度加速的时代即将结束!
模型
训练
研究
2024-11-18
扩散模型失宠?端侧非自回归图像生成基础模型Meissonic登场,超越SDXL
Meissonic发布,专为消费级显卡设计,高效生成1024×1024图像。
图像
生成
训练
2024-11-13
硅谷深思:GPT应用迟未爆发,大模型泡沫根源初探
大模型行业泡沫正在显现。
模型
训练
数据
2024-10-11
Nature曝惊人内幕:论文被天价卖出喂AI!出版商狂赚上亿,作者0收入
Nature的一篇文章透露:你发过的paper,很可能已经被拿去训练模型了!有的出版商靠卖数据,已经狂赚2300万美元。然而辛辛苦苦码论文的作者们,却拿不到一分钱,这合理吗?
数据集
论文
训练
科技
2024-08-16
李沐创业这一年:张一鸣宿华给建议,黄仁勋帮忙搞卡,逃离地狱模式后要做“人类陪伴的智能体”
迄今最真诚的大模型创业复盘。
李沐
创业
训练
创投
2024-08-16
苹果用谷歌TPU训练AI,都怪英伟达太贵?
谷歌好用还便宜。
谷歌
训练
英伟达
模型
芯片
2024-08-01
OpenAI掀小模型血战!苹果DCLM强势登场,碾压Mistral 7B全开源
小模型时代来了?OpenAI带着GPT-4o mini首次入局小模型战场,Mistral AI、HuggingFace本周接连发布了小模型。如今,苹果也发布了70亿参数小模型DCLM,性能碾压Mistral-7B。
模型
训练
科技
2024-07-22
6700万参数比肩万亿巨兽GPT-4!微软MIT等联手破解Transformer推理密码
来自微软、MIT等机构的学者提出了一种创新的训练范式,攻破了大模型的推理缺陷。他们通过因果模型构建数据集,直接教模型学习公理,结果只有67M参数的微型Transformer竟能媲美GPT-4的推理能力。
模型
训练
编码
2024-07-15
对国内AI算力紧缺问题的若干看法
由于算力严重紧缺,过去一个月国产大模型的“降价”,很大程度上只是“行为艺术”罢了。
算力
推理
训练
2024-06-11
谷歌向微软英特尔全面宣战!首款自研Arm CPU,最强大模型公测,AI视频对垒Sora
昨晚的Google Cloud Next 2024大会上,谷歌接连放出一堆模型和产品王炸:Gemini 1.5 Pro公开可用、上线音频处理能力;代码模型CodeGemma上新,首款自研Arm处理器Axion正式向微软和亚马逊宣战……这次,谷歌要以量取胜。
谷歌
训练
大模型
科技
2024-04-11
硅谷创业一年,贾扬清讲了自己的AI行业观察:成本、市场增量和商业模式
一个通用的大模型的效果固然非常好,但是在企业实际应用当中,中小型模型加上自己的数据,可能反而能够达到一个更好的性价比。
英伟达
贾扬清
训练
模型
2024-03-26
查看更多内容
热门文章
1
DeepSeek 爆火背后,必须看清的3大趋势
2
一款伪直播应用,赚了百万美元
3
DeepSeek上车,救不了掉队的车企
4
尊界S800的对手,迈巴赫还是蔚来ET9?
5
AI干不掉的中国“土特产”,一夜席卷全国
6
420万创业者,抢滩“养宠盛世”
7
微信接入DeepSeek后,腾讯正在把产品all in AI
8
上海,无赫赫之功
9
DeepSeek成BAT生死符,不接入就出局?
10
AI救场,阿里死而复生?
反馈
联系我们
推荐订阅