GeForce RTX 4000 Serisi grafik kartlarıyla sunulan başlıca yeni özelliklerden biri, Shader Execution Reordering’in kısaltması olan SER’dir. Işın izlemenin yavaş ama emin adımlarla daha yaygın hale gelmesiyle SER, yürütme ve veri farklılığını azaltarak gölgelendirici verimliliğini artırmayı hedefliyor. Adından da anlaşılacağı gibi, bu sonucu, tutarlılığı artırmak için iş parçacıklarını gerçek zamanlı olarak yeniden sıralayarak elde eder. Ayrıca ışın kesişimi ve gölgeleme işlemlerini birbirinden ayırır.

NVIDIA, Wccftech’e kısa bir Soru-Cevap bölümünde SER’in (tıpkı Opacity Micro-Maps ve Displaced Micro-Mesh gibi, diğer iki performans geliştirmesi) bir oyunda açık geliştirici entegrasyonu gerektirdiğini ve kendi API NVAPI uzantısıyla birlikte geldiğini onayladı. Neyse ki, NvRTX Unreal Engine 5 dalı yakında en popüler yeni nesil motorda SER desteği ekleyen 5.0.3 sürümüne güncellenecektir. NVIDIA’ya göreShader Execution Reordering, ışın izleme işlemlerinde kaliteyi etkilemeden %40’a varan kare hızı optimizasyonu sağlayabilir.

İlginç bir şekilde, SER, donanım ışın izleme etkinleştirildiğinde UE5 Lumen’in performansını da artırır. NVIDIA üç örnek kullanım durumu sağladı. Yol izleme, performans kazanımlarının yüzde 20 ila 50 arasında değişebildiği ilk ve en basit olanıdır.

Yol izleme, oldukça farklı bir iş akışı sunarak onu SER uygulamak için harika bir aday haline getirir. SER uygulamak, yol izleyicinin yalnızca sekme sayısı yerine malzeme değerlendirmesindeki sapmayı azaltmasına olanak tanır.

NVIDIA’ya göre bu sahne SER sayesinde %40 daha hızlı işleniyor.

SER, sapmayı azaltmak için gölgelendiricileri yeniden düzenlemenin ötesinde faydalı olabilir. Örneğin NVIDIA, Lumen’in donanım ışın izlemeli Global Illumination kullanıldığında iş sıkıştırmanın anlamlı faydalar sağlayabileceğini söyledi.

UE5 Şehir Örneği gibi büyük sahneler için izler, aralarında sıkıştırma ile ayrı izleme geçişleri olarak yürütülen yakın ve uzak alana bölünür. Çoklu geçişler ve sıkıştırma, tek bir NVReorderThread çağrısı ile değiştirilebilir. Bu, yakın alan izlemenin sonuçlarını sıkıştırmak ve ardından uzak alan ışınlarını başlatmak için gereken GPU’daki boş baloncukları önler.

Fazladan depolama, sıkıştırma ve yeniden başlatma iş yükünü ortadan kaldırmak, genellikle %20’lik bir tasarruf değerindedir. Orijinal koddaki varsayımlar nedeniyle gölgelendirici değişiklikleri daha yoğun olabilir (argümanlar yerine davranışları değiştirmek için makroları kullanan işlevler). Bununla birlikte, mantıksal değişiklikler, bir izin isabet edip etmediğine ilişkin tek bir Boole ifadesi ile iki yeniden sıralama çağrısı eklenmesi anlamına geliyordu.

Son olarak, NVIDIA, Lumen’in donanım ışın izlemeli yansımalarıyla üçüncü bir (ancak daha karmaşık) kullanım durumunu ayrıntılı olarak açıkladı. Burada tipik olarak çalışan iki farklı ışın izleme boru hattı vardır, biri yakın ve uzak alan izleme için, diğeri ise çarpma aydınlatması için.

SER etkinleştirildiğinde, ayrı sıkıştırma ve ayırma aşamaları artık gerekli olmadığından geçişler birleştirilebilir. Geçiş kabaca iz yakın alan haline gelir, eğer bir isabet uzak alanı değilse, isabet ederse, malzemeyi değerlendirmek ve aydınlatma yapmak için isabet nesnesini kullanır. Bu, izleme ve gölgelemenin ayrılması nedeniyle mümkündür.

Yukarıda açıklanan uygulama, UE5 Şehir Örneği’nde tipik bir iş yükünün profilini çıkarırken ölçülen, GPU üzerindeki Lümen yansımalarında %20-30’luk bir hız artışıyla sonuçlandı.

Motorunuza SER desteği eklemekle ilgilenen bir geliştiriciyseniz, teknik incelemenin tamamına bakmak isteyebilirsiniz. Yakın gelecekte hangi oyunların Shader Execution Reordering’i (veya Opacity Micro-Maps ve Displaced Micro-Mesh’i) destekleyeceği henüz belli değil, ancak hem NVIDIA hem de oyun stüdyoları ile araştıracağız.



genel-17