Nvidia, ABD ihracat düzenlemelerine uymayı amaçlayan Çin odaklı bir başka GPU SKU’sunu piyasaya sürmeye hazırlanıyor. Kaynaklar Reuters Nvidia’nın en son GPU’sunun, Nvidia’nın bugüne kadarki en hızlı AI GPU’su olan Blackwell B200’ün bir yan ürünü olacağını ortaya koyuyor. GPU’nun gelecek yıl piyasaya sürülmesi bekleniyor, ancak teknik özellikler hala açık bir soru.

Geçici olarak “B20” olarak adlandırılan yeni çip, Nvidia’nın bölgedeki en büyük ortaklarından biri olan Inspur tarafından Çin genelinde dağıtılacak. B20’nin 2025’in 2. çeyreğinde resmi olarak piyasaya sürüleceği bildiriliyor.

Şu anda kısırlaştırılmış Blackwell GPU ile ilgili özellikler tamamen bilinmiyor, ancak B20’nin giriş seviyesi bir parça olması kaçınılmaz görünüyor – endüstri lideri AI performansına sahip B200 ile tam bir tezat oluşturuyor. ABD, Çin GPU ihracatları için, TFLOPS miktarını ve bir GPU’nun hesaplama yeteneklerinin hassasiyetini hesaba katan “Toplam İşlem Gücü” (TPP) adlı bir ölçüt kullanarak katı performans düzenlemelerine sahiptir. Özellikle, TPP’yi elde etmek için TFLOPS’u (seyreklik olmadan) bit cinsinden hassasiyetle çarpın.

Mevcut sınır 4.800 TPP olarak belirlendi. Referans olması açısından, Hopper H100 ve H200 her iki GPU’da 16.000 TPP ile bu sınırı çok aşıyor; bu metrik, H200’ün masaya getirdiği başlıca iyileştirmeler olan bellek bant genişliğini veya kapasitesini doğrudan hesaba katmıyor. Hatta RTX 4090 bile FP8 hesaplamasının 660,6 TFLOPS’uyla sınırı geçiyor. 4.800 TPP sınırı içinde kalan en güçlü Nvidia masaüstü GPU’su, özellikle ihracat kısıtlamalarına uymak için üretilen RTX 4090D’dir.

Blackwell, çift kalıplı bir çözümün potansiyel olarak yaklaşık 4.500 TFLOPS FP8 hesaplaması üretmesiyle hesaplama performansında çıtayı yükseltiyor. Bu, izin verilen sınırın 7,5 katı anlamına gelir. Daha düşük B100 bile 3,5 PFLOPS yoğun FP8 hesaplaması veya 28.000 TPP sunacaktır.

B20 ayrıca ABD’nin özellikle veri merkezi GPU’larını hedef alan bir “performans yoğunluğu” (PD) kısıtlaması uygulaması nedeniyle ek kısıtlamalarla karşı karşıyadır (tüketici GPU’ları bu kısıtlamadan muaftır). TPP puanını alın ve PD metriğini elde etmek için kalıp boyutuna bölün; 6.0’ın üzerindeki her şey kısıtlanır. Bu metriği kullanarak, her RTX 40 serisi GPU veri merkezi kullanımı için kısıtlanır ve Blackwell, Ada Lovelace’ın yoğunluğundan ve performansından daha iyi olmalıdır. Bu nedenle, Nvidia’nın düzenlemelere uymak için B20 performansını ciddi şekilde kısması ve/veya orantılı olarak daha büyük bir kalıp kullanması gerekecektir. (Daha önce duyurulan B200’ün tam kalıp boyutunu hala bilmiyoruz.)

B20’nin Nvidia’nın A30 ve H20 giriş seviyesi AI GPU’larının halefi olmasını bekliyoruz. Örneğin H20, H100/H200’deki 1.979 TFLOPS’a kıyasla sadece 296 TFLOPS FP16 sunuyor. Bu, PD’yi 6,0’ın altında tutmak için 2.368’lik bir TPP’dir – sadece 2,90’lık bir PD derecesine sahiptir. Bu arada A30’un TPP derecesi 2.640 ve PD puanı 3,20’dir. Yani Nvidia’nın Çin için daha hızlı bir AI GPU yaratması için yer var… ancak fazla Çok daha hızlı.

B20’nin satılması zor bir çip olacağını düşünmeden edemiyoruz. Hem Ampere hem de Hopper zaten performans sınırının ötesinde, bu yüzden Nvidia düzenlemelere uymak için Çin’e özgü SKU’lar yarattı. Blackwell mimarisindeki tüm gelişmeler onu daha da uyumsuzluğa itiyor, çünkü maksimum TPP değişmedi, bu da uyumlu kalmak için performansı geri almak anlamına geliyor. En iyi durum? Nvidia belki 4.000-4.500 TPP ve 800 mm^2 kalıp boyutuna sahip bir GPU yaratmayı düşünecektir.



genel-21