Intel bugün AI iş yükleri için Gaudi 3 hızlandırıcısını resmen tanıttı. Yeni işlemciler, AI ve HPC için Nvidia’nın popüler H100 ve H200 GPU’larından daha yavaş, bu nedenle Intel, Gaudi 3’ünün başarısını daha düşük fiyatına ve daha düşük toplam sahip olma maliyetine (TCO) bağlıyor.
Intel’in Gaudi 3 işlemcisi, 64 tensör işlemci çekirdeği (TPC’ler, FP32 akümülatörlü 256×256 MAC yapısı), sekiz matris çarpım motoru (MME’ler, 256 bit geniş vektör işlemci) ve 19,2 TB/s bant genişliğine sahip 96 MB yonga üstü SRAM önbelleği içeren iki yonga kullanır. Ayrıca Gaudi 3, 24 200 GbE ağ arayüzünü ve 14 medya motorunu entegre eder; ikincisi, görüntü işlemeyi desteklemek için H.265, H.264, JPEG ve VP9’u işleyebilir. İşlemciye, 3,67 TB/s’lik muazzam bir bant genişliği sunan sekiz bellek yığınında 128 GB HBM2E bellek eşlik eder.
Intel’in Gaudi 3’ü, 24 TPC, iki MME ve 96 GB HBM2E belleği taşıyan Gaudi 2 ile karşılaştırıldığında büyük bir gelişmeyi temsil ediyor. Ancak, Intel’in hem TPC’leri hem de MME’leri basitleştirdiği anlaşılıyor çünkü Gaudi 3 işlemcisi yalnızca FP8 matris işlemlerini ve BFloat16 matris ve vektör işlemlerini destekliyor (yani artık FP32, TF32 ve FP16 yok).
Performansa gelince Intel, Gaudi 3’ün yaklaşık 600W TDP’de 1856 BF16/FP8 matris TFLOPS’a kadar ve 28,7 BF16 vektör TFLOPS’a kadar sunabileceğini söylüyor. Nvidia’nın H100’üyle karşılaştırıldığında, en azından kağıt üzerinde, Gaudi 3 biraz daha düşük BF16 matris performansı (1.856’ya karşı 1.979 TFLOPS), iki kat daha düşük FP8 matris performansı (1.856’ya karşı 3.958 TFLOPS) ve önemli ölçüde daha düşük BF16 vektör performansı (28,7’ye karşı 1.979 TFLOPS) sunuyor.
Ham özelliklerden daha önemli olan Gaudi 3’ün gerçek dünya performansı olacak. AMD’nin Instinct MI300 serisi ve Nvidia’nın H100 ve B100/B200 işlemcileriyle rekabet etmesi gerekiyor. Ve bu, yazılıma ve diğer faktörlere bağlı olduğu için henüz görülecek bir şey. Şimdilik Intel, Gaudi 3’ün Nvidia’nın H100’üne kıyasla önemli bir fiyat performans avantajı sunabileceğini iddia eden bazı slaytlar gösterdi.
Intel bu yılın başlarında, bir anakart üzerinde sekiz Gaudi 3 işlemciye dayalı bir hızlandırıcı kitinin 125.000 dolara mal olacağını belirtmişti, bu da her birinin yaklaşık 15.625 dolara mal olacağı anlamına geliyor. Buna karşılık, bir Nvidia H100 kartı şu anda 30.678 dolarbu yüzden Intel gerçekten de rakibine karşı büyük bir fiyat avantajına sahip olmayı planlıyor. Yine de, Blackwell tabanlı B100/B200 GPU’larının sunduğu potansiyel olarak muazzam performans avantajlarıyla, mavi şirketin rakibine karşı avantajını sürdürüp sürdüremeyeceği henüz belli değil.
Intel’in Veri Merkezi ve Yapay Zeka Grubu’nun başkan yardımcısı ve genel müdürü Justin Hotard, “Yapay zeka talebi veri merkezinde büyük bir dönüşüme yol açıyor ve sektör donanım, yazılım ve geliştirici araçları konusunda tercih istiyor” dedi. “P çekirdekli Xeon 6 ve Gaudi 3 AI hızlandırıcılarını piyasaya sürmemizle Intel, müşterilerimizin tüm iş yüklerini daha yüksek performans, verimlilik ve güvenlikle uygulamalarına olanak tanıyan açık bir ekosistem sağlıyor.”
Intel’in Gaudi 3 AI hızlandırıcıları IBM Cloud ve Intel Tiber Developer Cloud’dan edinilebilir. Ayrıca Intel’in Xeon 6 ve Gaudi 3 tabanlı sistemler genel olarak Dell, HPE ve Supermicro’dan dördüncü çeyrekte edinilebilir olacak, Dell ve Supermicro’dan sistemler Ekim ayında, Supermicro’dan makineler ise Aralık ayında gönderilecek.