主题:Grok3-马斯克千倍算力打造跑分没全面领先DeepSeek -- 脊梁硬
- 共: 💬 2 🌺 16
- 新: 💬 1
马斯克十万块H100 GPU
计算200天得到的新模型
使用的算力超过了DeepSeek R1杭州团队的千倍
北京时间2月18号闪亮发布
看他的性能评估图
精心挑选了比较对象,特意(吗)没有对标最新版的deepSeek R1, 而是它的老版本v3
看常用的比较参数,老米这种大力堆硬件飞砖战略得到的 AI 模型表现不佳。可以说是败给了国人如DeepSeek 的大脑
为了加入他(刻意)略去的 DeepSeek R1模型,我搜集了有共同对标厂家产品(GPT-4o, Caude-3.5 Sonnet)的参数图表,保证多图表比较有共同参考系。
DS R1 跑分在左边,三项里领先两项,另外一项接近打平
科学 Science GPQA: 71.5 : 75
编程Coding LCB LiveCodeBench: 65.9 : 57
数学MATH AIME 24: 79.8 :52
而且DS的稀释小模型32B, 可以普通个人电脑运行的,也 分别达到跑分 62.1,57.2, 72.6 , 也三项里领先两项。
当然他还有各种吹嘘的深度思索复杂思索能力,不在这些常用跑分覆盖,我们拭目以待吧。
通宝推:审度,
本帖一共被 1 帖 引用 (帖内工具实现)
- 相关回复 上下关系2
🙂Grok3-马斯克千倍算力打造跑分没全面领先DeepSeek
🙂我怀疑他明修栈道,暗度陈仓 4 onlookor 字1177 2025-02-20 08:12:06