资讯
邦连接
创业服务
创业邦学园
在线课堂
天使基金
优企酷
邦出海
产业创新
城市创新
大企业创新
创投联盟
研究咨询
睿兽分析
活动
榜单
年度榜单
实时榜单
搜索
公众号
登录 | 注册
个人中心
工作台
会员中心
我的邦积分
我的订阅
我的消息
# 推理能力 #
文章
8
阅读
9.4K
关注
0
关注
「推理革命」爆发100天:DeepSeek-R1复现研究全揭秘!
本文深入梳理了围绕DeepSeek-R1展开的多项复现研究,系统解析了监督微调(SFT)、强化学习(RL)以及奖励机制、数据构建等关键技术细节。
语言模型
推理能力
科技
05-06
两张图定位全球,o3碾压T0级高手!人类「诡计」被看穿,跨模态推理爆表
o3推理有多强?猜图大师Sam Patterson伪造GPS坐标想套路OpenAI o3,AI仅凭两张90°视图锁定地点,以23179分胜人类22054。假EXIF被AI识破,AI跨模态推理潜力呼之欲出,「视觉+搜索+思维链」正在改写人机博弈。
推理能力
AI
05-04
全球顶尖AI来考公,不会推理全翻车!致命缺陷曝光,被倒数5%人类碾压
公考行测中的逻辑推理题,是不少考生的噩梦,这次,CMU团队就此为基础,打造了一套逻辑谜题挑战。实测后发现,o1、Gemini-2.5 Pro、Claude-3.7-Sonnet这些顶尖大模型全部惨败!最强的AI正确率也只有57.5%,而人类TOP选手却能接近满分。
推理能力
模型
04-18
OpenAI重新开源,第一弹就推理模型,还不限制商用,“冲着DeepSeek来的”
又创纪录融了400亿美元
模型
推理能力
语言模型
科技
04-01
OpenAI秘密武器「草莓」计划曝光!Q*推理能力大爆发,逼近AGI L2里程碑
OpenAI被曝出了新项目「草莓」,据悉能提前计划,自主浏览网页,还能进行深度研究。草莓由大量通用数据上后训练而成,推理能力显著提高。根据OpenAI最近的AGI路线图,草莓疑似已达Level 2。
推理能力
能力
暴风科技
2024-07-14
百倍提升7B模型推理能力,昆仑万维携手新加坡南洋理工大学发布Q*算法
打破OpenAI垄断!昆仑万维颜水成团队推出Q*算法,百倍提高模型推理能力
推理能力
模型
算法
昆仑万维
2024-06-25
两句话,让LLM逻辑推理瞬间崩溃,最新“爱丽丝梦游仙境”曝出GPT、Claude等重大缺陷
爱丽丝有N个兄弟,她还有M个姐妹。爱丽丝的兄弟有多少个姐妹?
模型
推理能力
2024-06-11
把GPT-3.5装进手机里?小模型爆发背后没什么神奇的魔法
Scaling Law(缩放定律)是AI界当下的金科玉律。简单解释的话它就是在说数据越多,参数越大,算力越强,模型最终的能力就越强。正是这一规则让OpenAI相信AGI可能到达,只要数据够多,参数够大,AGI就一定能达到。
Sora大模型
推理能力
科技
2024-04-28
热门文章
1
上交大博士自研3D图形引擎,AI加持之下效率倍增,赢得比亚迪等头部客户
2
那些小创业者们的困扰
3
“Nerd之王”做的App,不到一个月登顶美国总榜
4
乐高乐园是伪装成迪士尼的少年宫
5
第一批“村咖”开不下去了,“主理人”们做错了什么?
6
报告解读 | 永续引擎持续加速,谁在叩响建筑科技的 “未来之门”
7
国产脱毛仪之王,坑惨年轻人
8
功能不“性感”,也能月入千万,工具App重新迎来窗口期?
9
“铁粉”口中的东方甄选:小米的参与感,胖东来的价值观,一种超越购物的精神力量
10
欧洲难舍燃油车
反馈
联系我们
视频号
小红书
抖音号
推荐订阅