Intel bugün AI iş yükleri için Gaudi 3 hızlandırıcısını resmen tanıttı. Yeni işlemciler, AI ve HPC için Nvidia’nın popüler H100 ve H200 GPU’larından daha yavaş, bu nedenle Intel, Gaudi 3’ünün başarısını daha düşük fiyatına ve daha düşük toplam sahip olma maliyetine (TCO) bağlıyor.

Intel’in Gaudi 3 işlemcisi, 64 tensör işlemci çekirdeği (TPC’ler, FP32 akümülatörlü 256×256 MAC yapısı), sekiz matris çarpım motoru (MME’ler, 256 bit geniş vektör işlemci) ve 19,2 TB/s bant genişliğine sahip 96 MB yonga üstü SRAM önbelleği içeren iki yonga kullanır. Ayrıca Gaudi 3, 24 200 GbE ağ arayüzünü ve 14 medya motorunu entegre eder; ikincisi, görüntü işlemeyi desteklemek için H.265, H.264, JPEG ve VP9’u işleyebilir. İşlemciye, 3,67 TB/s’lik muazzam bir bant genişliği sunan sekiz bellek yığınında 128 GB HBM2E bellek eşlik eder.

Intel’in Gaudi 3’ü, 24 TPC, iki MME ve 96 GB HBM2E belleği taşıyan Gaudi 2 ile karşılaştırıldığında büyük bir gelişmeyi temsil ediyor. Ancak, Intel’in hem TPC’leri hem de MME’leri basitleştirdiği anlaşılıyor çünkü Gaudi 3 işlemcisi yalnızca FP8 matris işlemlerini ve BFloat16 matris ve vektör işlemlerini destekliyor (yani artık FP32, TF32 ve FP16 yok).

Performansa gelince Intel, Gaudi 3’ün yaklaşık 600W TDP’de 1856 BF16/FP8 matris TFLOPS’a kadar ve 28,7 BF16 vektör TFLOPS’a kadar sunabileceğini söylüyor. Nvidia’nın H100’üyle karşılaştırıldığında, en azından kağıt üzerinde, Gaudi 3 biraz daha düşük BF16 matris performansı (1.856’ya karşı 1.979 TFLOPS), iki kat daha düşük FP8 matris performansı (1.856’ya karşı 3.958 TFLOPS) ve önemli ölçüde daha düşük BF16 vektör performansı (28,7’ye karşı 1.979 TFLOPS) sunuyor.



genel-21