周六,国内AI大模型公司DeepSeek在知乎发布《DeepSeek-V3/R1推理系统概览》技术文章,首次公开了其核心优化方案及成本利润率等关键数据,引发行业震动。数据显示,若按理论定价计算,单日成本利润率高达545%,刷新了全球AI大模型领域的盈利记录。
业内分析认为,DeepSeek的开源策略和成本控制能力正在打破AI领域的资源垄断。此次“透明化”披露不仅展示了其技术实力与商业潜力,还传递了一个明确信号:AI大模型的盈利闭环已从理想变为现实。文章提到,DeepSeek-V3/R1推理系统的优化目标是提高吞吐量并降低延迟,通过大规模跨节点专家并行(EP)实现。此外,DeepSeek还详细介绍了如何使用EP增加批量大小、隐藏传输耗时以及进行负载均衡。
值得注意的是,DeepSeek还首次公布了理论成本和利润率等关键信息。根据官方数据,在最近24小时内,GPU租赁成本为87072美元,而单日收入可达562027美元,成本利润率为545%。尽管实际收入低于此数,但高利润率依然显著。DeepSeek通过创新的推理系统设计,包括大规模跨节点专家并行、计算通信重叠和负载均衡优化三大技术支柱,实现了高效运行。白天高峰时段全力支持推理服务,夜间闲置节点用于研发训练,最大化硬件利用率。此外,缓存命中率达56.3%,大幅降低了算力消耗。
中信证券指出,DeepSeek在模型训练成本降低方面的实践将刺激科技巨头采用更经济的方式加速前沿模型的研究,并推动大量AI应用落地。本周以来,DeepSeek开启“开源周”,连续发布了多项重要开源项目,如FlashMLA、DeepEP、DeepGEMM、Optimized Parallelism Strategies、Fire-Flyer文件系统(3FS)及Smallpond数据处理框架,进一步巩固了其在行业的领先地位。