Oyunların şu anda 3D sahneleri işleme şeklinin en büyük dezavantajlarından biri, CPU ile GPU arasında hala şaşırtıcı miktarda ileri geri iletişimin gerekli olmasıdır. Bu ek yük, grafik kartının işlenmesini çeşitli şekillerde yavaşlatabilir. Ancak yeni bir teknik ortaya çıktı AMD herhangi bir ekstra işlem gücüne ihtiyaç duymadan performansı 1,64 kat artırarak bunu büyük ölçüde azaltmayı başardı.
Bu teknik, şu anda ışın izlemesi olmayan iş yükleri için satın alabileceğiniz en iyi grafik kartı olan AMD Radeon RX 7900 XTX üzerinde gösterildi, ancak bu teknik, bu kadar üst düzey bir GPU gerektirmiyor. Bu nedenle, birçok oyunda çok sayıda GPU için performans artışları görülebilir.
Bu atılım, birçok iş yükünde, GPU üzerinde bir başlangıç hesaplaması yaptırabileceğiniz ve daha sonra GPU üzerinde de bazı sonraki işlerin yapılması gerektiğinin belirlenebileceği gerçeğiyle ilgilidir. Bununla birlikte, mevcut GPU iş yükü kurulumunda, bu sonraki çalışmanın CPU tarafından tetiklenmesi gerekir, bu nedenle GPU’dan CPU’ya ve tekrar geriye doğru küçük bir gidiş-dönüş gereklidir (genellikle DirectX’in D3D12’sindeki ExecuteIndirect komutunu kullanarak). GPU’nun tüm süreci kendisinin idare edebilmesi nedeniyle bu hem verimsiz hem de yavaştır.
Bunun için ilk geçici çözüm birkaç yıl önce önerildi; çalışma grafikleri. Çalışma grafikleri, bir geliştiricinin, olası işlevlerden ve sonraki adımlardan oluşan birbiriyle ilişkili bütün bir çerçeveyi tanımlamasına olanak tanır; böylece GPU, CPU’ya gitmek zorunda kalmadan bir sonraki işlevin hangi işlevi gerçekleştireceğini bilir.
O halde bugünkü demo, ağ düğümleri adı verilen çalışma grafiklerinin bir uzantısıdır. AMD’den Matthäus Chajdas’ın belirttiği gibi AMD OpenGPU blogu“Mesh düğümleri… bir çalışma grafiğinin doğrudan bir mesh gölgelendiriciye beslenmesine izin vererek çalışma grafiğinin kendisini steroidler üzerinde bir amplifikasyon gölgelendiriciye dönüştürür.”
Bütün bunları anlamadın mı? Aslında bu, akıllı çalışma grafiği çerçevelerinin, oyun içi araziyi anında oluşturmak için kullanılan programlar olan ağ gölgelendiricileri doğrudan tetiklemesine olanak tanıyor. Bu, çalışma grafiği kurulumunun oldukça spesifik bir kullanım durumudur, ancak AMD, hepsi tek bir başlangıç harfi kullanarak prosedürel olarak yüzlerce öğe (yukarıda gösterilen sarmaşık gibi – sol daha az, sağ daha çok öğe oluşturur) üreten bir demo ile gücünü gösterir. GPU’ya çağrı gönderin. Sonuç olarak AMD, bu demoda geleneksel ExecuteIndirect yönteminin ağ düğümleri sisteminden 1,64 kat daha yavaş olduğunu ölçebildi. Video demosunu yukarıda bağlantısı verilen AMD blogunda görebilirsiniz.
Bütün bunlar mevcut ve gelecekteki oyunlar için ne anlama geliyor? Bu, oyunlarımızdan daha fazla performans elde etmek isteyen geliştiricilerin isteyebileceği bir teknik daha. Bunun gibi bir tekniğin tam kare hızını ne kadar etkileyeceği gerçekten açık değil, ancak genel olarak sistem kaynaklarını ve özellikle CPU kaynaklarını serbest bırakarak, ortaya çıkan diğer sistem darboğazları sayesinde performansın artma potansiyeli var.