Nvidia’nın AI ve HPC uygulamaları için Blackwell GPU’larını ertelemesi ihtimali, büyük bir sunucu tedarikçisi olan Supermicro’ya göre AI sunucu üreticileri ve AI sunucu pazarı üzerinde önemli bir etki yaratmayacak. Charles Liang’ın yorumu (via Alfa’yı arıyorumSupermicro’nun CEO’su ), Nvidia’nın yeni nesil B100 ve B200 işlemcilerinin yeniden tasarlanmaları gerektiği için geciktiğinin teyidi olarak değerlendirilebilir.
Liang, şirketin finansal analistler ve yatırımcılarla yaptığı kazanç görüşmesinde, “Nvidia’nın biraz gecikme yaşayabileceğini duyduk ve bunu normal bir olasılık olarak değerlendiriyoruz” dedi. “Yeni bir teknoloji, yeni bir ürün sunduklarında, [there is always a chance] biraz dışarı itme olacak. Bu durumda, biraz dışarı itti. Ancak bizim için, müşteriye H200 sıvı soğutma gibi yeni bir çözüm sağlamada sorun yaşamadığımıza inanıyorum. Bunun gibi birçok müşterimiz var. Bu nedenle, programa göre daha iyi dağıtım yapmayı umsak da, bu bir teknoloji şirketi için iyi, ancak bu dışarı itmenin genel olarak bizim için etkisi çok fazla olmamalı.”
Nvidia’nın B100 ve B200 GPU’ları, TSMC’nin CoWoS-L paketlemesini bir Super Carrier ara parçasıyla kullanan sektörün ilk ürünleridir. Yeniden dağıtım katmanı (RDL) ara parçasına entegre edilmiş aktif veya pasif yerel silikon ara bağlantı (LSI) köprüleri kullanılarak (H100 için kullanılan CoWoS-S durumunda silikon ara parçası yerine) retikül boyutunun altı katına kadar sistem-paketlerinin oluşturulmasını sağlar.
Köprü kalıplarının yerleştirilmesi, özellikle iki ana hesaplama kalıbı arasındaki köprüler için olağanüstü hassasiyet gerektirir, çünkü bunlar 10 TB/s yonga seti-yonga seti ara bağlantısını sürdürmek için gereklidir. Bu köprü kalıplarını içeren önemli bir tasarım sorununun, bunların yeniden tasarlanmasını gerektirdiği söyleniyor. Yarı Analiz GPU yongaları, LSI köprüleri, RDL ara parçası ve anakart alt tabakası arasında termal genleşme katsayısı (CTE) uyumsuzluğu olabileceğini ima eder, bu da tüm SiP’nin eğrilmesine ve bozulmasına neden olur. Ancak bu hiçbir zaman resmi olarak doğrulanmadı. Ek olarak, üst küresel yönlendirme metal katmanlarının yeniden tasarlanması ve Blackwell GPU silikonundan çıkıntıların çıkarılması gerektiği yönünde raporlar var, bu da aylarca gecikme anlamına geliyor.

Yarı Analiz Nvidia’nın planlandığı gibi 2024’ün dördüncü çeyreğinde HGX sunucuları için 1000W B200’ü düşük hacimlerde üretmeye devam edeceğini bildiriyor, kısmen sınırlı CoWoS-L kapasitesi ve kısmen de yukarıda belirtilen sorunlar nedeniyle. Ayrıca, üst düzey GB200 tabanlı NVL36 ve NVL72 sunucuları (1200W B200 kullanan) dördüncü çeyrekte düşük hacimlerde de olsa bazı müşterilere sunulacak.
Alt ve orta seviye AI sistemlerine olan talebi karşılamak için Nvidia, 144 GB (dört yığın) HBM3E içeren monolitik bir B102 silikonu içeren ve eski güzel CoWoS-S (veya Amkor, ASE, SPIL veya hatta Samsung’dan gelen rakip teknolojiler) kullanılarak paketlenmiş B200A ürünü üzerinde çalışıyor. Bu parçanın 2025’in ikinci çeyreğinde çıkması bekleniyor. Yeni model, 144 GB’a kadar HBM3E bellek ve 4 TB/sn’ye kadar bellek bant genişliği sunan 700W ve 1000W HGX form faktörlerinde satışa sunulacak. Ancak bunun H200’den daha az bellek bant genişliği sunduğunu belirtmek önemlidir. Bununla birlikte, B102 kalıbının grafik kartları için grafik odaklı GB202 işlemciyle bir ilgisi olup olmadığı belirsizdir.
Nvidia’nın orijinal B200’ü, LSI’sini veya paketin kendisini yeniden tasarlamayı planlayıp planlamadığını bilmiyoruz. Yine de, Yarı Analiz Nvidia’nın Blackwell Ultra adlı Blackwell serisinin orta nesil yükseltmesi üzerinde çalıştığını iddia ediyor. ‘Ultra’ serisi, resmen B210 veya B200 Ultra olarak adlandırılan iki yonga, CoWoS-L paketlemesi kullanacak. Blackwell Ultra, 12Hi HBM3E’nin 288 GB’a kadar bellek yükseltmesini ve %50’ye kadar FLOPS’ta performans artışını içeriyor.
Nvidia’nın B210/B200 Ultra’sının 2025’in 3. çeyreğinde 1000W ve 1200W versiyonlarında piyasaya sürülmesi bekleniyor, bu nedenle üst düzey, yüksek hacimli Blackwell GPU’larının gecikmesi önemli görünüyor. Genel olarak AI sunucularına olan talep ve Nvidia’nın H100/H200 GPU’ları göz önüne alındığında, yeşil şirket muhtemelen B200 ile ilgili sorunlarını aşmayı başaracaktır.

