GeForce RTX 40 serisi ekran kartlarına güç sağlayacak NVIDIA Ada Lovelace Gaming GPU ile ilgili detaylar ortaya çıktı. Yeni bilgiler şuradan geliyor: kopte7kimi & yeni nesil mimarinin blok diyagramından bahsediyor.

NVIDIA GeForce Ada Lovelace GPU SM Blok Şeması Ayrıntılı: Oyuncular İçin Her zamankinden Daha Büyük ve Daha İyi!

NVIDIA Ada Lovelace GPU mimarisi artık bir sır değil. GeForce RTX 40 serisi grafik kartları için bir sonraki Nesil AD10* serisi SKU’lara güç sağlayacak özel yapılandırmaları öğrendik ve ayrıca serinin teknik özelliklerinin sızdırıldığını gördük. Şimdi, tamamen yeni nesil grafik yongasının kendisinden bahsetmenin zamanı geldi.

NVIDIA GeForce RTX 4090, 21 Gbps ve 600W TDP’de 24 GB GDDR6X Bellek Alır, RTX 4070, 18 Gbps ve 300W TDP’de 12 GB GDDR6 Bellek Alır

NVIDIA AD102 ‘Ada Lovelace’ Oyun GPU’su ‘SM’ Blok Şeması (Resim Kredisi: Kopite7kimi):

NVIDIA GA102 ‘Amper’ Oyun GPU’su ‘SM’ Blok Şeması:

Kopite7kimi, GPU yapılandırmasından başlayarak, en iyi AD102 GPU’yu yeşil ekibin diğer çeşitli GPU’larıyla karşılaştırır. Bunlara oyun odaklı Ampere GA102 ve Turing TU102 dahildir ve ayrıca listeye HPC-Focused Hopper GH100 ve Ampere GA100 eklenmiştir. HPC odaklı tasarımlar tüketici odaklı tekliflerden çok farklı olduğu için AD102’yi yalnızca oyun öncülleriyle karşılaştıracağım.

Mayıs 2022 için NVIDIA ve AMD GPU Fiyatlandırma Güncellemesi: GeForce Grafik Kartları Artık MSRP’ye Göre %14, Radeon MSRP’ye Göre Yalnızca %6’da

NVIDIA Ada Lovelace AD102 GPU, 12’ye kadar GPC’ye (Grafik İşleme Kümeleri) sahip olacaktır. Bu, yalnızca 7 GPC içeren GA102’ye kıyasla %70’lik bir artıştır. Her GPU, mevcut çip ile aynı konfigürasyon olan 6 TPC ve 2 SM’den oluşacaktır. Her SM (Akış Çok İşlemcisi), aynı zamanda GA102 GPU ile aynı olan dört alt çekirdeği barındıracaktır. Değişen, FP32 ve INT32 çekirdek yapılandırmasıdır. Her alt çekirdek 128 FP32 birimi içerecek, ancak birleşik FP32+INT32 birimleri 192’ye çıkacak. Bunun nedeni, FP32 birimlerinin IN32 birimleriyle aynı alt çekirdeği paylaşmamasıdır. 128 FP32 çekirdeği, 64 INT32 çekirdeğinden ayrılmıştır.

Yani toplamda, her bir alt çekirdek 128 FP32 artı 64 INT32 birimden toplam 192 birimden oluşacaktır. Her bir SM’de toplam 512 FP32 birimi artı 256 INT32 birimi ve toplam 768 birim olacaktır. Ve toplam 24 SM birimi (GPC başına 2) olduğundan, toplam 18.432 çekirdek için 12.288 FP32 Birimi ve 6.144 INT32 birimine bakıyoruz. Her SM ayrıca SM başına 64 sarma için iki Sarma Programı (32 iplik/CLK) içerecektir. Bu, çekirdeklerde (FP32+INT32) %50’lik bir artış ve GA102 GPU’ya kıyasla Sargılarda/İş Parçacıklarında %33’lük bir artıştır.

NVIDIA Ada Lovelace GPU Özellikleri ‘Ön’:

GPU Adı AD102 GA102 TU102 GA100 GH100
CPG 12 (GPU Başına) 1.7x 2 kere 1.5x 1.5x
CPT 6 (GPC Başına) Aynı Aynı 0.75x 0.67x
SM 2 (TPC Başına) Aynı Aynı Aynı Aynı
Alt Çekirdek 4 (SM Başına) Aynı Aynı Aynı Aynı
FP32 128 (SM Başına) Aynı 2 kere 2 kere Aynı
FP32+INT32 192 (SM Başına) 1.5x 1.5x 1.5x Aynı
çarpıtmalar 64 (SM Başına) 1.33x 2 kere Aynı Aynı
İş Parçacığı 2048 (SM Başına) 1.33x 2 kere Aynı Aynı
L1 Önbellek 192 KB (SM Başına) 1.5x 2 kere Aynı 0.75x
L2 Önbellek 96 MB (GPU Başına) 16x 16x 2.4x 1,6x
ROP’lar 32 (GPC Başına) 2 kere 2 kere 2 kere 2 kere

Önbelleğe geçerken, bu, NVIDIA’nın mevcut Ampere GPU’lar üzerinde büyük bir destek sağladığı başka bir segment. Ada Lovelace GPU’ları, SM başına 192 KB L1 önbellek paketleyecek, bu da Ampere’ye göre %50’lik bir artış. Bu, en üstteki AD102 GPU’sunda toplam 4,5 MB L1 önbellek demektir. L2 önbelleği, sızıntılarda belirtildiği gibi 96 MB’a çıkarılacak. Bu, yalnızca 6 MB L2 önbelleği barındıran Ampere GPU’ya göre 16 katlık bir artıştır. Önbellek GPU genelinde paylaşılacaktır.

Son olarak, Ampere göre 2 kat artışla GPC başına 32’ye yükseltilmiş ROP’larımız var. En hızlı Ampere GPU olan RTX 3090 Ti’de yalnızca 112’ye karşılık gelecek nesil amiral gemisinde 384’e kadar ROP’a bakıyorsunuz. Ayrıca, DLSS ve Raytracing performansını bir sonraki seviyeye yükseltmeye yardımcı olacak Ada Lovelace GPU’larda bulunan en yeni 4. Nesil Tensör ve 3. Nesil RT (Raytracing) çekirdekleri olacak. Genel olarak, Ada Lovelace AD102 GPU şunları sunacak:

  • 2x GPC (Amper’e Karşı)
  • %50 Daha Fazla Çekirdek (Amper’e Karşı)
  • %50 Daha Fazla L1 Önbellek (Amper’e Karşı)
  • 16x Daha Fazla L2 Önbellek (Amper’e Karşı)
  • ROP’ları İkiye Katlayın (Amper’e Karşı)
  • 4. Nesil Tensör ve 3. Nesil RT Çekirdekleri

2-3 GHz aralığında olduğu söylenen saat hızlarının denkleme alınmadığını, dolayısıyla Ampere’ye göre çekirdek başına performansı iyileştirmede de önemli bir rol oynayacaklarını unutmayın. Yeni nesil Ada Lovelace oyun GPU’larına sahip NVIDIA GeForce RTX 40 serisi grafik kartlarının 2022’nin ikinci yarısında piyasaya sürülmesi bekleniyor ve Hopper H100 GPU ile aynı TSMC 4N işlem düğümünü kullandığı söyleniyor.

NVIDIA CUDA GPU (SÖYLENTİ) Ön Bilgisi:

GPU’lar TU102 GA102 AD102
amiral gemisi SKU’su RTX 2080 Ti RTX 3090 Ti RTX4090?
Mimari Turing Amper Ada Lovelace
işlem TSMC 12nm NFF Samsung 8nm TSMC 4N?
kalıp ölçüsü 754mm2 628mm2 ~600mm2
Grafik İşleme Kümeleri (GPC’ler) 6 7 12
Doku İşleme Kümeleri (TPC’ler) 36 42 72
Akış Çok İşlemcili (SM) 72 84 144
CUDA Çekirdekleri 4608 10752 18432
L2 Önbellek 6MB 6MB 96MB
Teorik TFLOP’lar 16 TFLOP 40 TFLOP ~90 TFLOP?
Bellek Türü GDDR6 GDDR6X GDDR6X
Hafıza kapasitesi 11 GB (2080 Ti) 24 GB (3090 Ti) 24 GB (4090?)
Bellek Hızı 14Gb/sn 21Gb/sn 24Gb/sn?
Bellek Bant Genişliği 616 GB/sn 1.008 GB/sn 1152 GB/sn?
Bellek Veriyolu 384 bit 384 bit 384 bit
PCIe Arayüzü PCIe Gen 3.0 PCIe Gen 4.0 PCIe Gen 4.0
TGP 250W 350W 600W?
Serbest bırakmak Eylül 2018 20 Eylül 2H 2022 (TBC)



genel-17