Nvidia dün yapay zeka hızlandırıcıları için devasa Blackwell nesil GPU’yu tanıttı ancak bir dizi parametreyi açıklamadı. Bugün internette bir şey ortaya çıktı.



Örneğin WCCF Tech kaynağı, yeni GPU’nun 40.960 CUDA çekirdeği, yani kalıp başına 20.480 çekirdek içerdiğini iddia ediyor. Yeni GPU’nun çift çipli bir çözüm olduğunu da hatırlatalım. Karşılaştırma yapmak gerekirse, GH100’ün 18.432 CUDA çekirdeği var, dolayısıyla artış çok da büyük değil. Ancak şirket hâlâ yeni GPU’nun yarısını ayrı olarak kullanmıyor, yani hâlâ 41.000’e yakın çekirdekten bahsediyoruz. Bu bilgi henüz Nvidia web sitesinde mevcut değil.

Aynı kaynak, basın bülteninde veya diğer büyük kaynaklarda yer almayan PCIe 6.0 desteğinden de bahsediyor.

Tom’s Hardware kaynağı ise yeni GPU’nun iki varyasyonundan bahsediyor: B100 ve B200. Teknik olarak aynı GPU’lardır, ancak biraz farklı parametrelere sahiptirler. Tam olarak neyin farklı olduğu belirsiz ve şu ana kadar yalnızca TDP – sırasıyla 700 W ve 1000 W ile ilgili veriler var. Aynı zamanda bu seçeneklerin performansı da farklıdır ancak bu hem frekans farkıyla hem de hesaplama birimlerinin kısaltılmasıyla sağlanabilir.

Her durumda, moda bağlı olarak yeni FP4 formatında B100 7 veya 14 PFLOPS performansına sahipken, B200 9 veya 18 PFLOPS’a sahiptir. İki yeni GPU’nun bulunduğu GB200 Grace Blackwell Superchip hızlandırıcı durumunda, performans 20 veya 40 PFLOPS’tur; bu, her işlemci zaten hesaba katıldığından, yeni GPU’nun tam sürümünde bu formda sunulduğu anlamına gelir. 10/20 PFLOPS için.

FP32 ve FP64 modlarında saf performansa ilişkin hala veri yok. Ancak örneğin FP64 Tensör modunda B100, B200 ve GB200 için rakam sırasıyla 30, 40 ve 90 PFLOPS’tur.



genel-22