近来,中国人工智能公司深度求索发布的开源大模型DeepSeek-R1风靡全球,引发热议:全民AI时代是否已经到来?过去两年,美国公司如OpenAI引领了大模型投资热潮,但这些模型能耗巨大、成本高昂,导致商业推广困难。DeepSeek则通过优化模型架构和训练过程,在减少计算资源消耗的同时,达到高性能,实现了低成本与高性能的双赢。此外,DeepSeek选择免费开源其大模型,推动技术从“奢侈品”变为“日用品”。
技术进步方面,低成本开源大模型开辟了新赛道,使得AI未来更加光明。降低成本是技术普及的关键,就像小汽车、个人电脑和手机一样,人工智能也需要降低门槛才能走进千家万户。DeepSeek的成功证明了这一点。尽管如此,大模型的成本仍有下降空间。开源代码、开放API及训练方法吸引了全球开发者参与迭代,进一步降低了成本。例如,有美国团队仅用几十美元便复现了DeepSeek模型。此外,字节跳动也推出了新的稀疏模型架构UltraMem,进一步提升了推理性能并降低了成本。
商业应用上,DeepSeek重塑了AI生态链,展示了巨大的商业潜力。美国AI巨头试图通过监管抑制开源AI,并抬高大模型准入门槛,形成垄断局面。而开源模型对全球AI供应链尤其重要,特别是对于发展中国家。开源模式让每个开发者都能轻松使用强大的AI工具,加速了AI的进化和普及。近期,多家上市公司宣布接入DeepSeek模型,显示市场对低成本高性能开源大模型的需求旺盛。然而,实现全民AI仍面临诸多挑战,包括建立激励机制避免社区碎片化、平衡开源与商业化、提升模型压缩技术、定制化开发垂直场景应用以及加强AI伦理教育等。总之,要让AI大模型成为全民红利,还需多方面的努力。