2025-03-02 14:58 阅读量:2.3万+
华人号:社会万象国内AI大模型公司DeepSeek官方账号在知乎首次发布《DeepSeek-V3/R1推理系统概览》技术文章,不仅公开了其推理系统的核心优化方案,更是首次披露了成本利润率等关键数据,引发行业震动。
据DeepSeek官方披露,DeepSeek-V3和R1的所有服务均使用H800 GPU。由于服务负荷白天高、晚上低,DeepSeek实现一套机制,在白天负荷高的时候用所有节点部署推理服务,晚上负荷低的时候减少推理节点。
2月27日至2月28日的24个小时内,DeepSeek-V3和R1推理服务占用节点总和,峰值占用为278个节点,平均占用226.75个节点(每个节点为8个H800 GPU)。假定GPU租赁成本为2美元/小时,总成本为87072美元/天。
若所有tokens的输入和输出全部按照DeepSeek R1的定价计算,理论上DeepSeek一天的总收入为562027美元,成本利润率高达545%。不过,由于DeepSeek-V3定价低于R1,且网页端和应用程序免费,仅部分服务产生收入,再加上非高峰时段设有夜间折扣,其实际收入不及理论数值。
来源:DeepSeek知乎官方账号
2月26日,DeepSeek在官网宣布,北京时间每日00:30至08:30的夜间空闲时段,DeepSeek开放平台推出错峰优惠活动。在此期间,API调用价格大幅下调:DeepSeek-V3降至原价的50%,DeepSeek-R1更是低至25%。DeepSeek称,鼓励用户充分利用这一时段享受更经济更流畅的服务体验。
“DeepSeek开源周”自2月24日启动,期间DeepSeek陆续开源了众多最新技术进展,包括FlashMLA、DeepEP、DeepGEMM和3FS四个开源项目以及DualPipe、EPLB等代码库。这些开源成果在业内引发了热烈讨论。
业内分析指出,DeepSeek的开源策略与成本控制能力正在打破AI领域的资源垄断。DeepSeek此次“透明化”披露,不仅展示了其技术实力与商业潜力,更向行业传递明确信号:AI大模型的盈利闭环已从理想照进现实,标志着AI技术从实验室迈向产业化的关键转折。
据外媒透露,DeepSeek正在加速研发DeepSeek-R2推理模型,这一模型原计划今年5月发布,但或许会提前,新模型有望可以生成更好的代码,并且使用英语之外的语言进行推理。
1、本站(网址:52hrtt.com)为用户提供信息存储空间等服务,用户保证对发布的内容享有著作权或已取得合法授权,不会侵犯任何第三方的合法权益。
2、刊载的文章由平台用户所有权归属原作者,不代表同意原文章作者的观点和立场。
3、因平台信息海量,无法杜绝所有侵权行为,如有侵权烦请联系我们(福建可比信息科技有限公司 邮箱:hrtt@52hrtt.com),以便及时删除。
© 2022 华人头条
服务热线 : 0591-83771172
福建可比信息科技有限公司 ©版权所有
直播备案号 闽ILS备201708250005
举报热线:0591-83771172
举报邮箱:hrtt@52hrtt.com
1、本站(网址:52hrtt.com)为用户提供信息存储空间等服务,用户保证对发布的内容享有著作权或已取得合法授权,不会侵犯任何第三方的合法权益。
2、刊载的文章由平台用户所有权归属原作者,不代表同意原文章作者的观点和立场。
3、因平台信息海量,无法杜绝所有侵权行为,如有侵权烦请联系我们(福建可比信息科技有限公司 邮箱:hrtt@52hrtt.com),以便及时删除。