DeepSeek R1模型的推出,在全球范围内引发了对算力长期需求的讨论,甚至一度导致英伟达股价下跌。然而,对于AI芯片初创公司而言,这不仅不是一个威胁,反而被视为一个扩展业务的巨大机会。随着越来越多的企业开始采用和部署DeepSeek的开源模型,对推理芯片及算力的需求正在显著增加。
Cerebras Systems,一家提供AI芯片并能通过自家计算集群为客户提供云服务的公司,其CEO Andrew Feldman向CNBC透露,在DeepSeek R1发布后,公司迎来了前所未有的服务需求高峰。他指出,开发者们渴望利用像DeepSeek R1这样的开源模型来替代OpenAI昂贵且封闭的解决方案。成本下降将推动AI技术在全球范围内的应用扩展,正如PC和互联网行业所经历的那样,AI正走在类似的长期增长道路上。
另一家名为Etched的AI芯片制造商也表示,自DeepSeek发布以来,已有数十家公司表达了合作意向,促使Etched调整资源分配,从训练集群转向推理集群。此外,d-Matrix首席执行官Sid Sheth认为,较小的开放模型能够以较低的成本达到与大型专有模型相当或更高的性能水平,这种趋势将进一步加速“推理时代”的到来。
实际上,尽管有人质疑算力需求是否会因此减少,但实际情况显示,算力仍然供不应求。例如,DeepSeek在2月6日因服务器资源紧张而暂时停止了API服务充值。根据国泰君安的分析,即使在普通推理情境下,DeepSeek每秒所需的推理算力也是巨大的。这意味着,低成本推理模型的普及不仅不会减少总体算力需求,反而会因为应用层面的繁荣带动成倍的总算力需求提升。
回顾历史,“杰文斯悖论”揭示了一个有趣的现象:当煤炭使用效率提高、成本降低时,其消费量反而增加了。如今,在AI领域,DeepSeek等低成本推理模型的出现似乎也在遵循这一规律。随着这些模型的应用场景不断扩大,虽然单位成本降低了,但整体市场对算力的需求却在快速增长。因此,未来的AI投入将不再单纯依赖于规模的扩大,而是更加注重从预训练到推理的转变,整个行业的前景依然乐观。