GeForce RTX 40 video kartları hakkında zaten çok şey biliniyor ve Web’de giderek daha fazla veri ortaya çıkıyor. Örneğin, GeForce RTX 4090, 600 W’lık bir TDP ile kredilendirilir, ancak RTX 4070 için zaten 300 W olacaktır. Yeni veriler, yeni ürünlerin GPU yapılandırmasına ışık tuttu.



Yani RTX 4090’a temel teşkil edecek olan AD102 GPU, 12 GPC bloğuna sahip olacak. Bu, yalnızca 7 GPC’ye sahip olan GA102’den %70 daha fazladır. Her GPC, GA102 yapılandırmasına karşılık gelen altı TPC ve iki SM’den oluşacaktır.

Değişen, FP32 ve INT32 çekirdek yapılandırmasıdır. Her alt çekirdek 128 FP32 bloğu içerecek, ancak toplam FP32+INT32 bloğu sayısı 192’ye yükselecek. Bunun nedeni, FP32 bloklarının IN32 blokları ile aynı alt çekirdeği paylaşmamasıdır. 128 FP32 çekirdeği, 64 INT32 çekirdeğinden ayrılmıştır.

Böylece, her bir alt çekirdek, toplam 192 blok için 128 FP32 bloğu artı 64 INT32 bloğundan oluşacaktır. Her SM’de toplam 512 FP32 modülü artı toplam 768 modül için 256 INT32 modülü olacaktır. Ve toplamda 24 SM modülü (GPC başına iki) olduğundan, ortak terminolojide toplam 18.432 CUDA çekirdeği için 12.288 FP32 modülümüz ve 6.144 INT32 modülümüz var.

GeForce RTX 4090 ne olacak. AD102 GPU'nun konfigürasyonu ve parametreleri hakkında detaylar ortaya çıktı.

Yeni GPU’lar, Ampere mimarisinden %50 daha fazla olan SM bloğu başına 192 KB L1 önbelleğe sahip olacak. Bu, üst AD102’de toplam 4,5 MB L1 önbellektir. Karşılaştırma için, GA102 yalnızca yaklaşık 1.8 MB’a sahiptir.

L2 önbelleği 96 MB olacak, bu zaten GA102’den 16 kat daha fazla! Aslında, bu AMD kartları için bir tür Infinity Cache analogudur.

Ayrıca yeni mimaride rasterleştirme birimlerinin (ROP) sayısı artacaktır. GPC bloğu başına 32 birim olacak, bu şu ankinin iki katı. GPC sayısı da artacağından, sonuç olarak AD120, GA102 için 112’ye karşılık 384 ROP’a sahip olacaktır. Geri kalanından, dördüncü nesil tensör çekirdekleri ve üçüncü nesil RT çekirdekleri rapor edilir.



genel-22