NVIDIA, 2026 ve 2027 için veri merkezi yol haritasında güncellemeleri duyurdu ve yaklaşan Rubin (astronom Vera Rubin’den sonra adlandırılan) ve Rubin Ultra için planlanan konfigürasyonları sergiledi. Blackwell B200’ü tam üretime getirmeyi bitirmiş olsa da ve 2025’in ikinci yarısı için Blackwell B300’ü olmasına rağmen, önümüzdeki iki yılı dört gözle bekliyor ve ortaklarının yaklaşan geçişler için planlanmasına yardımcı oluyor.
Yapılan ilginç noktalardan biri “Blackwell’in yanlış adı verildi”. Kısacası, Blackwell B200 aslında GPU başına iki ölüme sahip, Jensen NVLink topolojisini değiştirdiğini söylüyor. Bu nedenle, mevcut çözümü çağırsa da Blackwell B200 NVL72, NV144L demenin daha uygun olacağını söylüyor. Nvidia’nın yaklaşan Rubin Solutions ile yapacağı şey bu.
Yukarıda mevcut Blackwell NVL72 altyapısı ile uyumlu olacak Rubin NVL144 rafı var. Karşılaştırma için ikinci slaytta Blackwell Ultra B300 NVL72 için aynı yapılandırma verilerine sahibiz. B300 NVL72, 1.1 PFLOP Yoğun FP4 hesaplama sunuyor, Rubin NVL144 – bu aynı toplam 144 GPU kalıbında – 3.6 PFLOP yoğun FP4 sunacak. Rubin ayrıca, sadece B300 için 0.36 Exaflops. Genel olarak, hesaplama performansında 3.3x bir gelişme.
Rubin ayrıca HBM3/HBM3E’den HBM4’e kaymayı işaretleyecek ve HBM4E Rubin Ultra için kullanılır. Bellek kapasitesi GPU başına 288GB olarak kalacaktır, B300 ile aynı, ancak bant genişliği 8 TB/s’den 13 TB/s’ye yükselecektir. Ayrıca, verimi toplam 260 TB/s’ye ikiye katlayacak daha hızlı bir NVlink ve 28.8 TB/s (B300 ve CX8’in bant genişliğinin iki katı) ile raflar arasında yeni bir CX9 bağlantısı olacaktır.
Rubin ailesinin diğer yarısı, mevcut Grace CPU’larının yerini alan Vera CPU olacak. Vera, 88 özel kol çekirdeği ve 176 iplik ile nispeten küçük ve kompakt bir CPU olacak. Ayrıca Rubin GPU’larla bağlantı kurmak için 1.8 TB/s NVLink çekirdek-çekirdek arayüzüne sahip olacak.
Rubin Ultra 2027’nin ikinci yarısına inecek ve Vera CPU kalacakken, şeylerin GPU tarafı başka bir büyük destek alacak. Tam raf, yeni bir düzen olan NVL576 ile değiştirilecek. Evet, bu her biri belirtilmemiş bir güç tüketimine sahip bir rafta 576 GPU’ya kadar.
FP4 ile çıkarım hesaplaması, 5 exaflop FP8 eğitim hesaplaması ile 15 exaflop’u roketleyecektir. Rubin NVL144’ün hesaplaması yaklaşık 4 kat, bu da çok fazla GPU’nun dört katı olduğunu düşünerek mantıklı. GPU’lar, hesaplama yoğunluğunu artırmak için bu sefer paket başına dört GPU kalıpına sahip olacak.
NVL144 Rubin çözeltisinin raf başına toplam 75 TB “hızlı belleğe” (hem CPU’lar hem de GPU’lar için) sahip olduğu yerlerde, Rubin Ultra NVL576 365 TB bellek sunacaktır. GPU’lar HBM4E alacak, ancak burada işler biraz meraklı. NVIDIA, 4.6 Pb/s HBM4E bant genişliğini listeler, ancak GPU başına 8 TB/s’ye kadar çalışan 576 GPU ile. Bu, GPU başına öncekinden daha az bant genişliği gibi görünmektedir, ancak belki de dört GPU ölmesinin birbirine nasıl bağlandığının bir faktörüdür. Ayrıca, 100 petaflop FP4 hesaplaması ile dört retikül büyüklüğünde GPU başına 1 TB HBM4E de olacaktır.
NVLink7 arayüzü, 1.5 pb/s verim ile Rubin’den 6x daha hızlı olacaktır. CX9 ara bağlantıları ayrıca raflar arasında 115.2 TB/s’ye 4 kat iyileşme görecektir – muhtemelen bağlantı sayısını dört katına çıkararak.
Açıkçası, Rubin ve Rubin Ultra hakkında henüz tam olarak bilmediğimiz çok şey var, ancak bu detaylar gelecekte ete çıkacak. Veri merkezlerinin tüketici GPU’larından çok daha fazla planlamaya ihtiyacı var, bu nedenle Nvidia, ürünlerin gönderilmeye hazır olmasından önce tüm ayrıntıları iyi paylaştı. Ve tam olarak bitmedi …

Rubin’den sonra, Nvidia’nın bir sonraki veri merkezi mimarisi teorik fizikçi Richard Feynman’ın adını alacak. Muhtemelen bu, Nvidia mevcut desenle devam ederse, Feynman GPU’ları ile Richard CPU’ları alacağımız anlamına gelir.



