OpenAI的图像生成功能升级后,需求激增导致了新的挑战。创始人Sam Altman提到,ChatGPT的文生图功能使用量过大,导致GPU过载。为缓解压力,OpenAI将暂时限制该功能的请求处理速度,优先保证文本生成和对话等核心服务的稳定性。3月26日推出的基于GPT-4o模型的图像生成功能,让用户通过自然语言指令就能生成和编辑图片,迅速走红。用户纷纷尝试将个人照片或知名梗图转化为吉卜力风格,Altman也感慨这一功能带来的巨大流量。
由于需求超出预期,原定本周向所有用户开放的新功能被迫推迟。与DALLE不同,GPT-4o的图像生成是嵌入在ChatGPT中的自回归模型,通过学习图像与语言的关系来生成上下文感知的图像。生成高质量图像需要大量GPU算力支持,每张图片渲染时间可达一分钟。面对算力瓶颈,解决方案包括提升GPU性能或优化算法。微软作为主要投资者,购买了大量英伟达Hopper芯片用于训练OpenAI的大模型。这反映了AI多模态技术发展中资源与需求之间的平衡难题,既需庞大算力支持,又需高效利用现有资源。