电商巨头亚马逊在云计算领域持续发力,自研AI产品不断更新。12月2日,亚马逊云科技(AWS)在re:Invent全球大会上推出了一系列AI新品,包括第三代定制AI芯片Trainium3和三款全新AI助理。AWS的CEO马特·加曼表示,Trainium业务已达到数十亿美元规模,并且增长迅速。

Trainium系列芯片专为AI训练和推理设计,旨在提高性能并降低成本。Trainium3采用3纳米工艺,性能是上一代的四倍,与同等GPU系统相比,可降低40%的成本。每颗芯片配备144 GB HBM3E高带宽内存,提供4.9 TB/s的内存带宽和2.5 PFLOPS的密集FP8运算性能。搭载Trainium3的Amazon EC2 Trn3 UltraServer能容纳144个Trainium3芯片,峰值算力达362 PFLOPs。AWS还宣布正在开发下一代Trainium4芯片,预计在FP4精度下提升6倍性能,内存带宽和容量也将大幅增加。此外,AWS与英伟达合作,Trainium4将支持NVLink Fusion高速互连技术,实现与GPU的无缝协同工作。
多家客户已采用Trainium3,如Decart公司使用后,实时视频生成速度提升了四倍,成本减半。Anthropic和理光等客户也通过Trainium芯片降低了高达50%的训练与推理成本。此外,AWS还推出了三款新AI助理:Kiro自主Agent、Amazon Security Agent和Amazon DevOps Agent,这些AI助理能在无需持续干预的情况下连续工作数小时甚至数天。尽管亚马逊在AI芯片市场上取得进展,但仍面临谷歌和英伟达的竞争。AWS高管表示,他们并不打算取代英伟达,而是希望提供更多选择,以满足客户对高性能和低成本的需求。