當?shù)貢r間4月9日,谷歌在美國舉行了“Google Cloud Next 25”大會,正式發(fā)布了專為AI設(shè)計的第七代TPU(Tensor Processing Unit)加速器“Ironwood”,單芯片峰值算力可達4,614 TFLOPs。
據(jù)介紹,Ironwood是谷歌首款在其張量核和矩陣數(shù)學單元中支持 FP8 計算的 TPU,而此前谷歌的 TPU 僅支持用于推理的 INT8 格式和處理以及用于訓練的 BF16 格式和處理。
Ironwood還大幅增加高頻寬內(nèi)存(HBM)容量,每顆芯片的HBM容量提高到了192GB,達到了Trillium的6倍,可處理更大型的模型和數(shù)據(jù)集運算,減少頻繁的數(shù)據(jù)傳輸需求,同時,HBM帶寬也大幅提升,Ironwood單顆芯片的內(nèi)存帶寬可達7.2Tbps,是Trillium的4.5倍,以確保數(shù)據(jù)快速存取。