主题：Grok3-马斯克千倍算力打造跑分没全面领先DeepSeek -- 脊梁硬

Grok3-马斯克千倍算力打造跑分没全面领先DeepSeek

马斯克十万块H100 GPU

计算200天得到的新模型

使用的算力超过了DeepSeek R1杭州团队的千倍

北京时间2月18号闪亮发布

看他的性能评估图

精心挑选了比较对象，特意（吗）没有对标最新版的deepSeek R1, 而是它的老版本v3

看常用的比较参数，老米这种大力堆硬件飞砖战略得到的 AI 模型表现不佳。可以说是败给了国人如DeepSeek 的大脑

为了加入他（刻意）略去的 DeepSeek R1模型，我搜集了有共同对标厂家产品（GPT-4o, Caude-3.5 Sonnet）的参数图表，保证多图表比较有共同参考系。

DS R1 跑分在左边，三项里领先两项，另外一项接近打平

科学 Science GPQA: 71.5 ： 75

编程Coding LCB LiveCodeBench: 65.9 ： 57

数学MATH AIME 24: 79.8 ：52

而且DS的稀释小模型32B, 可以普通个人电脑运行的，也分别达到跑分 62.1，57.2, 72.6 , 也三项里领先两项。

当然他还有各种吹嘘的深度思索复杂思索能力，不在这些常用跑分覆盖，我们拭目以待吧。

点看全图

通宝推：审度,

本帖一共被 1 帖引用 (帖内工具实现)

相关回复上下关系2
- 🙂Grok3-马斯克千倍算力打造跑分没全面领先DeepSeek
  - 🙂我怀疑他明修栈道，暗度陈仓 4 onlookor 字1177 2025-02-20 08:12:06

有趣有益，互惠互利；开阔视野，博采众长。
虚拟的网络，真实的人。天南地北客，相逢皆朋友