Nvidia’nın H20 veri merkezi GPU’su, bu ayki en son ABD ihracat düzenlemelerine uyacak şekilde tasarlandı, ancak bir rapora göre gecikmiş gibi görünüyor. Reuters. Büyük ölçüde Çin’de kullanılması amaçlanan H20’nin gecikmesi Nvidia için bir sorun oluşturabilir, çünkü Çin’e özgü GPU’lardan oluşan ürün yığını H20 olmadan biraz zayıftır ve Çin’de boşluğu doldurabilecek başka şirketler de vardır.
H20 veri merkezi GPU’su şu anda Nvidia’nın şirketin Çin’de yasal olarak satabileceği en hızlı grafik kartıdır. Diğer iki uyumlu GPU’nun yanı sıra, bu ayın başlarında, neredeyse en yeni Amerikan ihracat düzenlemeleri yürürlüğe girer girmez duyuruldu.
Yukarıdaki grafik mevcut ABD düzenlemelerini gösterir ve nelere izin verilip verilmediğinin ayrıntılarını gösterir. Performans yoğunluğu büyük ölçüde sınırlı olmasa da performans (TPP veya Toplam İşleme Performansı olarak tanımlanır) ciddi şekilde kısıtlanmıştır. En düşük performans yoğunluğunda bile Çin’e gönderilen hiçbir GPU, A100 ile hemen hemen aynı seviyede bir TPP’ye sahip olamaz. Aşağıda Nvidia’nın GPU’larının grafikte nasıl yer aldığını görebilirsiniz (resmin tamamını görmek için tweet’i genişletin).
AI hesaplama kısıtlama haritası (UBS)NVDA pic.twitter.com/opcrCF25aX11 Kasım 2023
Bu ikinci grafik (daha fazla ayrıntı için tıklayın) gerçek GPU’lara izin verildiğini ve hangilerine izin verilmediğini göstermektedir. A100 ve A800’ün yanı sıra A30 ve A40 gibi alt uç çipler de yasaklandı. RTX 4090 bile zar zor bu başarıyı elde edemedi ve artık yasaklandı. H20, GPU spesifikasyonlarının kısıtlı bölgesine ayak uydurarak en tatlı noktaya ulaşıyor. Yaklaşık 2.500 TPP derecelendirmesiyle, Nvidia’nın Çin’de yasal olarak satılabilen en hızlı GPU’sudur.
H20’nin bu yılın sonlarında diğer iki uyumlu GPU olan L20 ve L2 ile piyasaya sürülmesi bekleniyordu. Fakat, Reuters Nvidia’nın H20’yi Mart ayına kadar ertelediğini bildirdi. Gecikmenin görünen nedeni, sunucu üreticilerinin H20 ile ilgili karşılaştığı sorunlardır; H20’nin lansmanı için son tarihin kısıtlı olduğu göz önüne alındığında bu pek de şaşırtıcı değil.
GPU | HGX H20 | L20 PCle | L2 PCle |
---|---|---|---|
Mimarlık | GPU | Hazne | GH100 | Ada Lovelace | AD102 | Ada Lovelace | AD104 |
Hafıza | 96 GB HBM3 | 48 GB GDDR6, ECC’li | 24 GB GDDR6, ECC’li |
Toplam İşlem Gücü (FP16/BF16) | 2.368 | 1.912 | 1.544 |
Performans Yoğunluğu | 2.9 | 3.13 | 5.2 |
Bellek Bant Genişliği | 4,0 TB/sn | 864 GB/sn | 300 GB/sn |
INT8 I FP8 Tensörü | 296 I 296 TFLOPS | 239 I 239 TFLOPS | 193 I 193 TFLOPS |
BF16 I FP16 Tensör | 148 I 148 TFLOPS | 119,5 I 119,5 TFLOPS | 96,5 ve 96,5 TFLOPS |
TF32 Tensör | 74 TFLOP | 59,8 TFLOP | 48.3 TFLOP |
FP32 | 44 TFLOP | 59,8 TFLOP | 24.1 TFLOPS |
FP64 | 1 TFLOP | Yok | Yok |
RT Çekirdeği | Yok | Evet | Evet |
MIG | 7 MIG’ye kadar | Yok | Yok |
L2 Önbellek | 60MB | 96 MB | 36MB |
Medya Motoru | 7 NVDEC, 7 NVJPEG | 3 NVENC (+AV1), 3 NVDEC, 4 NVJPEG | 2 NVENC (AVI), 4 NVDEC, 4 NVJPEG |
Güç | 400W | 275W | henüz bilinmiyor |
Form faktörü | 8 yollu HGX | 2 yuvalı FHFL | 1 yuvalı LP |
Arayüz | PCIe Gen5 x16: 128 GB/sn | PCle Gen4 x16: 64 GB/sn | PCle Gen4 x16: 64 GB/sn |
NVLink | 900 GB/sn | – | – |
Örnekler | Kasım 2023 | Kasım 2023 | Kasım 2023 |
Üretme | Aralık 2023 | Aralık 2023 | Aralık 2023 |
Görünüşte, bir ürünü dört ay boyunca piyasaya sürememek pek de yıpratıcı olmayabilir. Eğer Çin veri merkezleri artık Nvidia GPU’lara ihtiyaç duyuyorsa, L2 veya L20’yi satın alabilirler. Reuters gecikmediğini söylüyor. Ancak Nvidia’nın H20’yi Çin’de piyasaya sürmek ve satmak için çok fazla zamanı olmayabilir.
Geçen yıl, Nvidia’nın A800 ve H800 modelleri, ABD’deki ihracat yasaklarının ilk turuna uymak amacıyla piyasaya sürüldü. Bu GPU’lar daha sonra bu yılın Ekim ayında uygulanan düzenlemelerle yasaklandı, bu da onların en fazla 11 ay boyunca piyasada kalacağı anlamına geliyordu. Eğer daha fazla düzenleme yasalaştırılırsa, H20’nin Çin’deki kullanım ömrü de kısa olabilir ve bu da dört aylık bir gecikmenin Nvidia için normalden çok daha fazla sorun yaratmasına neden olabilir.
Nvidia’nın mevcut ortamda GPU sağlama becerisine ilişkin endişeler belki de şimdiden sonuçlara yol açıyor. Nvidia’nın Çin’e özel en yeni GPU’ları duyurulmadan hemen önce Baidu, bunun yerine Huawei ASIC’leri satın aldı. Baidu daha önce binlerce Ampere ve Hopper GPU satın almıştı ve bu durum, şirketin Nvidia’nın gelecek grafik yongalarını beklemeye istekli olmadığını gösteriyor.
Günümüzün sürekli değişen ABD düzenlemeleri ortamında, Amerikan şirketlerinin Çin’de rekabet edebilmesi için esneklik ve hız gerekiyor. Ancak işlemciler hızlı geri dönüş süresi olan ürünler değildir. H20 durumunda, Nvidia’nın onu mümkün olan en kısa sürede piyasaya sürme çabaları sonuç vermedi ve bu, Amerikan teknoloji şirketinin hem performans avantajına hem de Çinli müşterilerin güvenine mal olabilir.