- 近期网站停站换新具体说明
- 按以上说明时间,延期一周至网站时间26-27左右。具体实施前两天会在此提前通知具体实施时间
主题:茗谈149:赤雁 -- 本嘉明
550万美元是“训练R1的费用”,也就是R1这个模型从头到尾训练一次的费用,其中显卡的费用是按“租用单价”*训练时间来算的,不是买断卡的钱。
deepseek r1训练用了2048个h800 GPU,共消耗278万GPU小时。每小时h800的费用大约2美元,这个是市场上租用的价格,含电费的。算下来就是550万美元左右。
btw: 所谓deepseek有5万张h100,不是马斯克说的。是一个华裔做生意的人亚历山大.wang说的,马斯克是采信而已。如果用2048个h800就能搞定,那老马的10万个h100的集群显得太傻了。
- 相关回复 上下关系8
压缩 2 层
🙂【讨论】国师又再顾左右而言他 38 金银鑫 字728 2025-02-03 02:53:05
🙂【讨论】OpenAI吃了一个闷亏 2 7 本嘉明 字1085 2025-02-04 07:09:00
🙂脑袋进了不少水,搬来不少垃圾,当然也应该谢谢你。 1 赢大奖 字0 2025-02-07 01:19:26
🙂又露怯了。老本看来不懂AI
🙂你就这么看好美国的执行力? 1 亮子 字126 2025-02-05 21:45:48
🙂【讨论】国师你不是自我打脸嘛 23 金银鑫 字540 2025-02-04 19:06:08
🙂【讨论】美国中部千万人口的大城是哪个? 2 本嘉明 字73 2025-02-04 21:59:12
🙂huggingface上有完整复制deepseek的训练 89 陈王奋起 字2109 2025-02-04 13:37:15