Nvidia’nın söylentilere konu olan yeni yapay zeka (AI) ve yüksek performanslı bilgi işlem (HPC) GPU serisi, ABD Ticaret Bakanlığı tarafından Ekim ortasında yayınlanan en yeni genişletilmiş ihracat kurallarıyla mükemmel bir şekilde uyumlu olduğuna inanıyor Patrick MoorheadMoor Insights & Strateji’nin başkanı. Basında yer alan bazı raporların aksine, şirketin yeni veri merkezi GPU’larıyla yapay zeka işlemcilerine yönelik genişletilmiş ABD yaptırımlarından kaçmaya çalışmadığına dikkat çekiyor. Bu arada Savunma Bakanlığı kısa süre önce, veri merkezleri için tasarlanmamış olsalar bile hangi ürünlerin Çin’e lisans olmadan gönderilemeyeceğini açıkladı ve görünüşe göre GeForce RTX 4090 da bunlardan biri.
“Dün, Nvidia’nın Çin ihracatına yönelik yeni veri merkezi hızlandırıcı kartlar serisiyle ABD Hükümeti İhracat Denetimi yasalarını ‘etrafından geçmeye’ veya ‘hızlı bir adım atmaya’ çalıştığını öne sürdüğü veya yorumlandığını düşündüğüm bir dizi makale yazıldı. ,” Moor yazdı bir blog yazısında. “Bunu gülünç buluyorum. Nvidia’nın dezavantajı çok büyük olabilir. Şirket amansız bir yenilikçi ve rakip olabilir ama aptal değiller.”
En son ABD Savunma Bakanlığı ihracat kuralları veri merkezi yapay zekası ve HPC işlemcileri Çin, Makao, Suudi Arabistan, Birleşik Arap Emirlikleri ve Vietnam’a gönderilen GPU’ları ve diğer yapay zeka hızlandırıcılarını kapsar; ürünlerinin belirli performans ve/veya performans yoğunluğu seviyelerini aşması durumunda satıcıların ihracat lisansı başvurusunda bulunmalarını şart koşuyorlar. Şirketlerin işini kolaylaştırmak için ABD Savunma Bakanlığı yakın zamanda halka açık bir brifing düzenledi ve bir işlemcinin Çin’e ve diğer kısıtlı ülkelere gönderilip gönderilemeyeceğini hızlı bir şekilde belirlemesine olanak tanıyan nispeten basit bir tablo sundu.
Yeni kurallar biraz karmaşık olabilir: Burada nelere izin verdiklerine, neleri yasakladıklarına ve bunun sizin için ne anlama geldiğine ayrıntılı bir bakış bulacaksınız.
Toplam İşleme Performansı
Performansa göre, yeni kurallar şunları tanımlar: Toplam İşleme Performansı (TPP) esasen listelenen işlem gücünün işlem uzunluğuyla çarpımı olan puan (ör. FLOP’lar veya ÜSTLER ‘8/16/32/64) seyreklik olmadan. ABD hükümeti, Çin’in (ister veri merkezleri ister istemci bilgisayarları için tasarlanmış olsun) 4800 TPP puanına sahip (matris çarpımı durumunda) işlemciler almasını istemiyor.
Örneğin, Nvidia’nın H100’ü 989 TFLOPS’luk listelenmiş bir FP16/BF16 performansına sahip ve bu da TPP puanının 7.912 olduğu anlamına geliyor, bu da onu Çin’e ihracat için çok güçlü kılıyor.
Nvidia’nın GeForce RTX 4090/’ının nedeni budur.AD102 Piyasadaki en iyi grafik kartlarından biri olan bu kart, FP8 Tensör FLOPS performansının (660 TFLOPS) 5.280 TPP puanına ulaşması nedeniyle ihracat lisansı verilebilir öğeler kategorisine de giriyor. Yani hayır, Nvidia ve ortakları 16 Kasım’dan itibaren GeForce RTX 4090’ı Çin’e gönderemeyecek.
Performans Yoğunluğu
En son kuralların getirdiği bir diğer parametre ise Performans Yoğunluğu (PD) metrik. Bu parametre, bir araya getirildiğinde sınırlı çipler kadar güçlü olabilecek çok sayıda daha küçük veri merkezi AI çipinin edinilmesine yönelik boşluktan kaçınmak için tasarlanmıştır. PD şu şekilde sayılır: TPP’nin milimetre kare cinsinden ölçülen kalıp alanına bölünmesi. Kalıp alanı yerleşik önbellekleri içerir ancak HBM’ler gibi harici bellek aygıtlarını hariç tutar. Bu, TPP puanı 1600 ile 4800 arasında olan küçük, yüksek yoğunluklu çipler için tasarlanmıştır.
Örneğin, Nvidia’nın L4/AD104 veri merkezi GPU’sunun TPP puanı 1936’dır (242 FP8 TFLOPS’8 = 1936). Ancak kalıp boyutu 294 mm^2’dir. Bu nedenle performans yoğunluğu 6,5 olduğundan L4 Çin’e gönderilemiyor. Bu arada, TPP puanı 1936 olan, veri merkezi olmayan bir ürün olan Nvidia’nın GeForce RTX 4070 Ti’si kısıtlama olmaksızın Çin’e gönderilebiliyor.
Yorumlama
Buradaki heyecan verici kısım, hükümetin bir ürünün veri merkezi kullanımı için tasarlanıp tasarlanmadığına dair yorumudur. Bu durumda ABD Savunma Bakanlığı, belirli bir ürünün varış yerini markalama yerine özelliklerine göre değerlendirmeyi planlıyor. Örneğin, fanlı veya pasif soğutuculu çift yuvalı bir GeForce RTX 4070 Ti, resmi adı ne olursa olsun bir veri merkezi kartı olarak kabul edilir.
ABD Ticaret Bakanlığı sekreter yardımcısı Thea D. Rozman Kendler, “Üretici ürünü veri merkezi kullanımı için pazarlamıyor olsa bile, ürün yine de ürünün teknik özelliklerine göre veri merkezi kullanımı için tasarlanmış olabilir” dedi. Sanayi ve Güvenlik Bürosu.
Nvidia’nın (İddia Edilen) Çin Veri Merkezi GPU Serisi
ABD Ticaret Bakanlığı’nın Ekim ortasında AI ve HPC iş yükleri için kullanılan veri merkezi işlemcilerine yönelik yeni ihracat kurallarını yayınlamasının ardından, bu kurallar o kadar ciddi göründü ki, Çin’e ve diğer ülkelere neredeyse hiçbir yüksek performanslı donanım gönderilemedi. Nvidia, Intel ve AMD, Çinli müşterilere tonlarca yapay zeka ve HPC donanımı gönderiyor ve bu satışları kaybetmek onlara milyarlarca dolarlık gelire mal olacak. Bu nedenle Nvidia’nın Çin pazarı için özel olarak tasarlanmış veri merkezi ürünleri serisiyle ABD hükümetini kandırdığına dair söylentiler yayılmaya başladı.
GPU | HGX H20 | L20 PCle | L2 PCle |
---|---|---|---|
Mimarlık | GPU | Hazne | GH100 | Ada Lovelace | AD102 | Ada Lovelace | AD104 |
Hafıza | 96 GB HBM3 | 48 GB GDDR6, ECC’li | 24 GB GDDR6, ECC’li |
Toplam İşlem Gücü (FP16/BF16) | 2.368 | 1.912 | 1.544 |
Performans Yoğunluğu | 2.9 | 3.13 | 5.2 |
Bellek Bant Genişliği | 4,0 TB/sn | 864 GB/sn | 300 GB/sn |
INT8 I FP8 Tensörü | 296 I 296 TFLOPS | 239 I 239 TFLOPS | 193 I 193 TFLOPS |
BF16 I FP16 Tensör | 148 I 148 TFLOPS | 119,5 I 119,5 TFLOPS | 96,5 ve 96,5 TFLOPS |
TF32 Tensör | 74 TFLOP | 59,8 TFLOP | 48.3 TFLOP |
FP32 | 44 TFLOP | 59,8 TFLOP | 24.1 TFLOPS |
FP64 | 1 TFLOP | Yok | Yok |
RT Çekirdeği | Yok | Evet | Evet |
MIG | 7 MIG’ye kadar | Yok | Yok |
L2 Önbellek | 60MB | 96MB | 36MB |
Medya Motoru | 7 NVDEC, 7 NVJPEG | 3 NVENC (+AV1), 3 NVDEC, 4 NVJPEG | 2 NVENC (AVI), 4 NVDEC, 4 NVJPEG |
Güç | 400W | 275W | henüz bilinmiyor |
Form faktörü | 8 yollu HGX | 2 yuvalı FHFL | 1 yuvalı LP |
Arayüz | PCIe Gen5 x16: 128 GB/sn | PCle Gen4 x16: 64 GB/sn | PCle Gen4 x16: 64 GB/sn |
NVLink | 900 GB/sn | – | – |
Örnekler | Kasım 2023 | Kasım 2023 | Kasım 2023 |
Üretme | Aralık 2023 | Aralık 2023 | Aralık 2023 |
Nvidia’nın Çin’e yönelik olduğu iddia edilen veri merkezi ürün serisine yakından bakıldığında, ailenin AI ve HPC GPU’larla ilgili en son ABD ihracat kurallarının olası ihlallerini önlemek için titizlikle tasarlandığı ortaya çıkıyor. Yeni teklifler grafikteki yeşil bölgeye sığacak şekilde tasarlandı, böylece ABD’nin Çin’e karşı yaptırımlarına uyum sağlarken Nvidia’nın giderek kısıtlanan Çin pazarındaki satışlarında kaybettiği 5 milyar doların bir kısmını telafi etmesine olanak tanıdı.