Analist Ming-Chi Kuo’ya göre Nvidia, tek raflı NVL72 ve NVL36’ya odaklanmak için çift raflı 72 yollu GB200 tabanlı NVL36×2’nin geliştirilmesini durduruyor. Orta. Kendisi saygın bir analist ve konuyla ilgili içeriden bilgi sahibi gibi görünüyor. Tek raflı NVL36 ve NVL72 makineleri planlandığı gibi pazara çıkacak ve kararın sınırlı kaynaklara ve müşteri tercihlerine göre verileceği belirtildi. Ancak önceki raporlar, çift raflı NVL36×2’nin Nvidia müşterileri arasında en popüler seçim olacağını gösteriyordu.
Şirket başlangıçta yapay zeka ve HPC iş yükleri için Blackwell GPU’larını temel alan üç GB200 modeli geliştirmeyi planladı: NVL36, NVL72 ve NVL36×2. Ancak, özellikle iki farklı 72 GPU sürümü (NVL72 ve NVL36×2) üzerinde aynı anda çalışmanın karmaşıklığı göz önüne alındığında, üç projenin tamamını yönetmek zorlayıcı hale geldi. Sonuç olarak Nvidia artık yalnızca NVL72 ve NVL36’ya odaklanıyor.
Nvidia’nın GB200 NVL72 rafı 18 hesaplama tepsisi ve dokuz NVSwitch tepsisi (18 NVSwitch ASIC) içerir; her birinde bir Grace CPU ve iki Blackwell GPU bulunan iki Bianca kartı bulunur. Bu, Nvidia’nın en güçlü teklifi olmasına rağmen, yaklaşık 120kW tükettiği için aynı zamanda en fazla güce ihtiyaç duyan çözümdür.
Yarı Analiz çoğu veri merkezinin destekleyemediği aşırı güç ve yoğunluk gereksinimleri (tipik raf gücü 12kW iken H100 tabanlı bir raf yaklaşık 40kW tüketir) nedeniyle bu yapılandırmanın sınırlı kullanımını beklemektedir. Ancak geniş çaplı dağıtım planlayan büyük bir müşteri var ve Ming-Chi Kuo, Microsoft’un NVL36×2 yerine NVL72’yi net bir şekilde tercih ettiğini iddia ediyor.
GB200 NVL36×2, birbirine bağlı iki raftan oluşacaktı ve başlangıçta daha yaygın olarak benimsenen konfigürasyon olacağı öngörülüyordu. Her rafta 18 Grace CPU ve 36 Blackwell GPU bulunur ve 72 GPU genelinde tam bağlantı sağlanır. Ancak 36 NVSwitch ASIC’ye ihtiyaç duyacağından, bir NVL72’den daha fazla güç tüketir ve biraz daha düşük performans sunar. Bir GB200 NVL36×2’nin raf başına 66kW (toplamda 132kW) tüketeceği tahmin ediliyordu; bu NVL72’den biraz daha yüksekti, ancak daha büyük boyutu mevcut veri merkezleriyle daha uyumlu olacaktı.
GB200 NVL72, GB200 NVL36×2’den çok daha fazla alan tasarrufu sağlar. Ancak çoğu Nvidia müşterisi NVL72’nin güç ve soğutma yoğunluğu gereksinimlerini destekleyemiyor. Ayrıca Ming-Chi Kuo’ya göre bu karmaşıklıklar, GB200 NVL72’nin sevkiyatını 2025’in ikinci yarısına kadar geciktirebilir. Ancak önceki raporlar, bazı NVL72 makinelerinin bu Aralık ayında muhtemelen Microsoft’a teslim edileceğini gösteriyordu.
Ming-Chi Kuo, “En son tedarik zinciri araştırmam, NVL72 seri üretiminin 2Y25’e kadar ertelenebileceğini gösteriyor (Nvidia’nın iyimser 1Y25 hedefine kıyasla)” diye yazdı Ming-Chi Kuo.
Bu yılın başlarında Nvidia, AI ve HPC için B100 ve B200 GPU’larının paketlenmesinde verimi düşüren sorunlarla karşılaştı ve bu durum, bu işlemcilerin tasarımını iyileştirmenin yanı sıra talebi karşılamak için düşük verimli Blackwell donanımı üretmeye sevk etti. Geliştirilmiş GPU’lar yalnızca Ekim ayı sonundan itibaren seri üretime girecek, dolayısıyla Ocak ayı sonlarında kullanıma hazır olacaklar. Bu bağlamda, maksimum performans arayan en talepkar müşterilere yönelik GB200 tabanlı NVL72 tasarımına odaklanmak Nvidia için kesinlikle mantıklı.
Ayrıca Blackwell işlemcili x86 tabanlı sunucuların yalnızca 2025’te kullanıma sunulacağını da belirtmek gerekiyor. Bu aşamada, bu makinelerin form faktörleri bilinmiyor ve ön raporlar NVL72 ve NVL36×2 makinelere işaret ediyor. Büyük olasılıkla artık önce NVL72 ve NVL36 raflarına yönelmiş, özel üçüncü taraf çözümleri daha sonra gelecektir.