Nvidia tabiriyle CUDA çekirdekleri olarak adlandırılan GPU gölgelendirici çekirdekleri ve ROP’lar, modern GPU’ların önemli yönleridir. Yaklaşan RTX 50 serisiyle Nvidia’nın her ikisinden de ziyade birinciye odaklandığı görülüyor. Harukaze5719 X hakkında rapor veriyor (resmi olarak Twitter), Nvidia’nın yakında çıkacak olan Blackwell RTX 50 serisi GPU’larının, Ada Lovelace RTX 40 serisi GPU’lara göre yalnızca CUDA çekirdek sayısında iyileştirmeler göreceğini ve ROP’ların çeşitli katmanlarda aynı kalacağını söyledi. Bunun tek istisnası giriş seviyesi GB207 kalıbıdır ve bu da %33 gibi muazzam bir oran elde edecektir. kesinti ROPS sayısında.
ROP’lar veya İşleme Çıkışı birimleri (aynı zamanda Raster Operasyon Boru Hatları), geleneksel GPU 3D işleme hattında hayati bir rol oynar. Adından da anlaşılacağı gibi piksel ve texel bilgilerinin işlenmesini, başka bir deyişle rasterleştirme iş yüklerini yönetirler. ROP’lar genellikle gölgelendirici çekirdekleri kadar önemli değildir ancak yine de GPU hattında önemli bir rol oynarlar. Optimum performansı sağlamak için ROP sayısını gölgelendirici çekirdeği ve diğer işlem kümelerinin sayısına göre ölçeklendirmek istiyorsunuz.
Peki o zaman şöyle olabilir mi? Kopite7kimi ve formüle dayalı tüm sayılar değişmez ( 1 GPC = 1 ROPs / 1 TPC = 2 SM / SM = 128 CUDA) https://t.co/158neeR86i pic.twitter. com/xmuvANTXi111 Haziran 2024
Harukaze’nin (popüler sızıntı kaynağı Kopite7kimi’nin formülüne dayanan) yeni bilgileri, Nvidia’nın Blackwell GPU mimarisinin oyun odaklı versiyonuna daha fazla render çıktı ünitesi eklemeyeceğini gösteriyor. Muhtemelen ana akım GB206’dan amiral gemisi GB202’ye kadar çeşitli GPU’ların Ada Lovelace (RTX 40 serisi) öncülleriyle tamamen aynı ROPS sayısına sahip olacağı iddia ediliyor. Tek istisna olan GB207’nin ROPS sayımlarını azaltmada işleri bir adım daha ileri götüreceği ve AD107’ye kıyasla %33’lük bir azalmaya sahip olacağı bildiriliyor.
Nvidia’nın ROPS sayısını artırmaması garip görünebilir, ancak büyük olasılıkla şirket mimarları Blackwell için zaten yeterli ROP bulunduğunu düşünüyor. Daha önce de belirtildiği gibi ROPS, özellikle ışın izleme, yükseltme ve diğer efektleri içeren modern iş yüklerinde GPU performansının tamamı ve sonu değildir. Mimari dengesiz hale gelirse daha fazla ROPS, daha fazla performans gerektirmez. Nvidia ayrıca Blackwell’deki bireysel ROPS performansını da geliştiriyor olabilir, bu da söylentilere ilişkin değişikliklere başka bir açıklama getirebilir.
GB207’nin %33 ROPS zayıflatmasını alın. Nvidia’nın mevcut AD107 GPU kalıbı, biraz daha büyük ve dolayısıyla daha pahalı olan AD106 kalıbıyla aynı ROPS sayısına sahiptir. Ancak bu görünen avantaja rağmen AD107 tabanlı GPU’lar hiçbir zaman AD106 tabanlı GPU’larla rekabet edemedi. RTX 4060 incelememizin gösterdiği gibi, AD107 donanımlı RTX 4060 kartı oyun performansı açısından RTX 4060 Ti’nin yanına bile yaklaşamıyor. İkisi arasındaki temel farklar CUDA çekirdek sayıları ve diğer işleme çekirdekleridir (RT, tensör ve doku).
Belki de AD107 “fazla belirlenmişti” ve Nvidia, ROPS sayısını GB207 ile azaltacak ve potansiyel olarak GB206 ile daha büyük bir fark yaratacaktır. Ayrıca Nvidia’nın CUDA çekirdek sayısını RTX 4060’taki 3.072’den daha az olan 2.560’a düşüreceği anlaşılıyor. Bu arada GB206’da 4.608’e kadar gölgelendirici var, bu da AD106 ile aynı sayı (ancak RTX 4060 Ti’de yalnızca 4.342 çekirdek etkinleştirilmiş). Bu değişiklikler büyük olasılıkla GB207 ve GB206 parçaları arasında daha büyük bir boşluk oluşmasına neden olacaktır.
CUDA çekirdeklerinden bahsetmişken, Nvidia’nın üst GB202 kalıbında 24.576’ya kadar gölgelendiriciye (192 SM – Akışlı Çok İşlemcili) sahip olacağı tahmin ediliyor. Bu aynı zamanda GDDR7 ile birleştirildiğinde bellek bant genişliğinde büyük bir artış sağlayabilecek 512 bitlik bir bellek arayüzüne sahip olacak. Öte yandan GB203, AD103’teki 80 SM ve 10.240 CUDA çekirdeğine kıyasla 84 adede kadar SM ve 10.752 gölgelendiriciyle ve ayrıca aynı 256 bit arabirimle (ancak GDDR7 desteğiyle) mevcut AD103’e benzer olacaktır. Bu söylentiler doğru çıkarsa, potansiyel RTX 5090 ile RTX 5080 arasında kesinlikle büyük bir uçurum var.
GB205, AD104’ün yerini alıyor, ancak AD104’ün 60 SM’ye ve 7.680 gölgelendiriciye sahip olduğu yerde, yeni çip görünüşe göre 50 SM ve 6.400 gölgelendiriciyle maksimuma çıkacak ve yine aynı 192 bit bellek arayüzüne sadık kalacak. GB206, 128 bitlik bir arayüzle AD106 öncülüyle aynı 36 SM ve 4.608 CUDA çekirdek sayısını koruyacak. Ve son olarak GB207 kalıbı, 128 bit GDDR6 bellek arayüzüyle yalnızca 20 SM ve 2.560 CUDA çekirdeği sunacak.
Umarız söylemeye gerek yoktur, ancak okuyucular sağlanan tüm bilgileri büyük bir şüpheyle karşılamalıdır. Bu resmi olmayan veriler bir sızıntıdan gelebilir ya da sadece söylenti tacirlerinin mantıklı olana dayanarak çeşitli fikirler sunması olabilir. Mevcut söylentilere göre Nvidia, ilk iki RTX 50 serisi GPU’yu yıl sonuna doğru piyasaya sürecek ancak son üç kalıp 2025’e kadar çıkmayacak. Bu, değişiklikler ve daha fazla spekülasyon için bolca zaman bırakıyor. Tüketici Blackwell mimari değişiklikleri hakkında da bir şey duymadık, ancak yükseltilmiş CUDA, Tensor ve RT çekirdeklerinin ve ayrıca ROPS ve diğer öğelerde de potansiyel değişikliklerin olacağı güvenli bir bahis.
Ancak kesin olan bir şey var: Eğer Nvidia gerçekten 512 bitlik bir bellek arayüzü ve en iyi GB202 çözümüyle 192’ye kadar SM’yi planlıyorsa, bu Olumsuz ucuza gel. Üstün performans, çok fazla güç ve banka hesabınızdan köpek balığı büyüklüğünde bir ısırık.