Adına bir sızdıran @davideneco25320 Twitter’da paylaştı bazı çok özel ayrıntılar Nvidia’nın yeni nesil Ada (aka Lovelace) GPU’ları hakkında, SM sayıları ve her yeni kalıbın adları dahil. Verileri doğruysa (ve son Nvidia hacki göz önüne alındığında, çok iyi olabilir), Ada, özellikle amiral gemisi GPU için RTX 30 serisi Ampere üzerinde büyük bir yükseltme olacaktır. Bu sızdırılmış veriler olduğundan ve tamamen güvenilemeyeceğinden, bu sonuçları bir tuz tanesi ile alın.
J’ai fait un petit grafiği pic.twitter.com/zilwXgi0va1 Mart 2022
Sızıntı, Nvidia’nın iki harfli ön ek ve üç basamaklı sayı sistemini Ampere nesli olarak koruyarak Ada nesli için isimlendirmesini değiştirmeyeceğini gösteriyor. AD102, büyük olasılıkla bir RTX 3090 veya Titan sınıfı kart için amiral gemisi GPU’yu belirtir ve AD103, bir sonraki en güçlü kalıp olarak (muhtemelen potansiyel bir RTX 4080 için) takip eder. AD104-106, orta seviye kalıplar (yani RTX 4070 ve RTX 4060) olarak aynı şeyi takip edecek ve AD107, Nvidia’nın Ada GPU’ları (yani bir RTX 4050 gibi bir şey) için giriş seviyesi pazarını dolduracak.
Ayrıca kod adlarının Nvidia’nın daha önce söylentili Lovelace kod adını değil Ada kod adını kullanacağını gösterdiğini unutmayın, bu nedenle şimdilik gelecekteki GPU’lara bu şekilde değineceğiz.
Önemli ölçüde değişen bir şey de Ada’daki SM sayısı. Amiral gemisi AD102 kalıbının, tek bir kalıpta 144 SM ile ölçekleri devireceği tahmin ediliyor. Karşılaştırma yapmak gerekirse, Ampere’nin GA102’si yalnızca 84 SM’ye sahiptir, yani bu SM sayısında %71’lik bir artıştır ve bu aynı şekilde GPU çekirdekleri, RT çekirdekleri, TMU’lar ve diğer öğeler için de geçerlidir. Bu, tek bir nesilde gördüğümüz en büyük sıçramalardan biri olacak.
Nvidia, Ada’daki CUDA çekirdeklerinin sayısını aynı tutarsa, bu, amiral gemisi kartı için 18.432 CUDA çekirdeğine bakabileceğimiz anlamına gelir. Nvidia’nın yaklaşmakta olan RTX 3090 TI ‘sadece’ tam GA102 yongasını kullanan 10,752 CUDA çekirdeğine sahip. Elbette, kısmen hasat edilmiş AD102 yongaları kullanan daha az varyantlar da göreceğiz ve 144 SM maksimum olabilirken, bazı grafik kartı modellerinde SM’lerin %10-20’sinin devre dışı bırakıldığını görmek bizi şaşırtmaz.
Rakamlar hala çok saygın olsa da, diğer çiplerdeki SM’lerin sayısı neredeyse o kadar yüksek değil. AD103’ün, GA103’ten %40’lık bir sıçrama ile 84 SM’li GA102 ile aynı 84 SM’ye sahip olacağı tahmin ediliyor. AD104, GA103 ile aynı 60 SM ile veya GA104’ten %25 daha fazla SM ile aynı şeyi yapacaktır. AD106, 36 SM ile GA106’ya biraz daha yakındır – %20’lik bir artış. Son olarak, AD107’nin GA107’ye kıyasla SM sayısında yine aynı saygın %20’lik artışla sadece 24 SM’ye sahip olacağı varsayılmaktadır.
Bu sızıntılar ve söylentiler doğru çıkarsa, gelecekteki RTX 4090 ve RTX 4080 gibi amiral gemisi kartların mevcut RTX 30 serisine göre inanılmaz performans iyileştirmeleri sunmasını bekleyebiliriz. En azından bazı açılardan Turing’e kıyasla Ampere’den kesinlikle daha büyük bir sıçrama. Örneğin RTX 3080, RTX 2080 Ti’nin 68 SM’sine kıyasla 68 SM’ye sahipti, ancak başka birçok değişiklik vardı.
Yukarıdakiler, Ada mimarisinin kendisinden gelen ve daha fazla fayda sağlayabilecek herhangi bir ek performans iyileştirmesini hesaba katmaz. Bir süredir Ada’nın en yeni N5 5nm düğümü ile Samsung’dan TSMC’ye geri döneceği söyleniyor. Bu tek başına verimlilik ve transistör sayısında Ampere’ye göre bazı önemli iyileştirmeler sağlamalı ve ayrıca daha yüksek saat hızlarının kilidini açabilir.
Gelecekteki PCIe 5.0 grafik kartları için şu anda geliştirilmekte ve üretilen yeni 16 pinli güç konektörlerinin eklenmesiyle Ada GPU’lar için güç tüketimi de artırılabilir. Tek bir fişten maksimum 600 W güç çıkışına sahip olan bu, Nvidia’ya Ada GPU’larda performansı artırmak için bir ton boşluk bırakacaktır.
Ada aynı zamanda ilk PCIe 5.0 uyumlu grafik çözümü olabilir ve PCIe bant genişliğindeki artış çok önemli olmasa da kesinlikle performansa zarar vermez. Bilmediğimiz şey ise Nvidia’nın Ada’daki temel yapı taşlarını ne kadar değiştirmeyi planladığı. Örneğin, Turing, farklı veriler üzerinde aynı anda çalışabilen SM başına 64 FP32 çekirdeğine ve 64 INT32 çekirdeğine sahipti. Amper bazı şeyleri değiştirdi, böylece INT32 çekirdekleri INT32 oldu veya FP32 çekirdekleri, potansiyel olarak FP32 performansını ikiye katlar.
Ampere ayrıca ışın izleme için 3. nesil Tensör çekirdeklerine ve 2. nesil RT çekirdeklerine sahiptir. Ada muhtemelen 4. nesil Tensör çekirdeklerini ve 3. nesil RT çekirdeklerini kullanacak. Bu ne anlama gelecek? Kesin ayrıntılara sahip değiliz, ancak Ada’nın mevcut Ampere GPU’lardan çok daha fazla performans sunacağı neredeyse kesin. SM başına daha fazla CUDA, Tensör ve/veya RT çekirdeği olabilir veya dahili boru hatları, verimi artırmak için basitçe yenilenebilir.
GPU performansı söz konusu olduğunda bellek de bir başka büyük oyuncudur ve Ada’nın kaç SM’ye sahip olabileceği düşünüldüğünde kare hızlarını iyileştirmede daha da büyük bir rol oynayabilir. GDDR6+ ve GDDR7, Samsung’un GDDR6X’e göre önemli bant genişliği iyileştirmeleri içeren yol haritasında zaten yer alıyor ve Nvidia, Ada üretimi için zamanında hazır olmaları durumunda büyük olasılıkla bu yeni standartlardan birini veya her ikisini kullanacak. Sonuçta, ne kadar çok çekirdeğe sahipseniz, hepsini beslemek için o kadar fazla bellek bant genişliğine ihtiyacınız olur.
Genel olarak konuşursak, Nvidia, önceki mimarilerle en hızlı GPU’larında performansı yaklaşık %30 artırdı, ancak işlem düğümündeki değişiklik ve büyük ölçüde artan çekirdek sayıları ve ayrıca potansiyel olarak daha yüksek bir güç sınırı ile Ada’dan daha da büyük iyileştirmeler beklemek gerçekçi değil.
RTX 4090 (veya adı ne olursa olsun) sonunda RTX 3090’ın iki katı performans sunacak mı? Bu iddialı ama kesinlikle ulaşılmaz değil. Daha yüksek saat hızlarına ve/veya daha verimli bir mimariye sahip %75 daha fazla çekirdek işi halledebilirdi. Ada’nın Eylül ayında piyasaya sürülmesi beklendiği için bu yıl daha fazlasını öğreneceğiz.