DeepSeek开源周进入第二天,今日宣布开源DeepEP软件库。DeepEP已在GitHub等平台获得超过1000个Star收藏,成为MoE模型训练和推理的通信基础。它支持高效全对全通信、低精度计算及非对称带宽转发场景优化,确保高吞吐量与流式多处理器数量控制。
此外,DeepSeek重新开放API充值,调整了DeepSeek-Chat模型的价格至每百万输入tokens 2元,输出tokens 8元。专家指出,DeepEP解决了MoE架构中GPU间通信瓶颈问题,提供高吞吐量、低延迟内核,并支持FP8操作。用户可通过调整参数或设置环境变量来管理流量隔离,提高灵活性。同时,由于低成本AI模型的推出,英伟达的人工智能芯片在中国市场的需求显著增加,带动相关股票上涨。阿里Qwen团队也发布了新的推理模型QwQ,进一步推动了算力需求的增长。