你的位置:开云·kaiyun(中国)体育官方网站 登录入口 > 新闻动态 >

开云体育以用来作念商榷和磨真金不怕火-开云·kaiyun(中国)体育官方网站 登录入口


发布日期:2026-04-23 05:25    点击次数:118

开云体育以用来作念商榷和磨真金不怕火-开云·kaiyun(中国)体育官方网站 登录入口

  3月1日,DeepSeek官方通过外交媒体账号公布了其线上系统的骨子统计数据,称若是通盘tokens一皆按照DeepSeek R1的订价盘算推算,表面上本钱利润率为545%。

   DeepSeek官方公布,DeepSeek V3和R1的通盘就业均使用H800GPU,使用和磨真金不怕火一致的精度,即矩阵盘算推算和dispatch传输聘任和磨真金不怕火一致的FP8措施,core-attention盘算推算和combine传输聘任和磨真金不怕火一致的BF16,最猛过程保证了就业后果。

  另外,由于白日的就业负荷高,晚上的就业负荷低,因此DeepSeek已毕了一套机制,在白日负荷高的工夫,用通盘节点部署推理就业。晚上负荷低的工夫,减少推理节点,以用来作念商榷和磨真金不怕火。在最近的24小时里(北京时分2025/02/2712:00至2025/02/2812:00),DeepSeek V3和R1推理就业占用节点总和,峰值占用为278个节点,平均占用226.75个节点(每个节点为8个H800GPU)。假设GPU租出本钱为2好意思金/小时,总本钱为$87,072/天。

  在24小时统计时段内,DeepSeek V3和R1:

  输入token总额为608B,其中342B tokens(56.3%)射中KVCache硬盘缓存。

  输出token总额为168B。平均输出速度为20~22tps,平均每输出一个token的KVCache长度是4989。

  平均每台H800的模糊量为:关于prefill任务,输入模糊约73.7k tokens/s(含缓存射中);关于decode任务,输出模糊约14.8k tokens/s。

  以上统计包括了网页、APP和API的通盘负载。若是通盘tokens一皆按照DeepSeek R1的订价盘算推算,表面上一天的总收入为$562,027,本钱利润率545%。

   DeepSeek官方暗示,骨子上莫得这样多收入,因为V3的订价更低,同期收费就业只占了一部分,另外夜间还会有扣头。

  本文系不雅察者网独家稿件,未经授权开云体育,不得转载。



友情链接: