Intel, yaklaşmakta olan XeSS AI yükseltme teknolojisi için bir açıklayıcı video yayınladı ve teknolojinin, neredeyse piyasaya sürülmeye hazır Arc Alchemist GPU’larında nasıl çalıştığını gösterdi. Gösteriler için en hızlı Arc A770’i kullandı, ancak gösterilen sınırlı performans ayrıntılarına dayanarak performansın en iyi grafik kartlarına karşı nasıl bir performans göstereceğini söylemek zor.
Nvidia’nın dört yıldır çeşitli enkarnasyonlarda bulunan DLSS’sine aşina iseniz, videonun keskin bir Deja Vu hissi uyandırması gerekir. Daha önce Nvidia için çalışan ve eski DLSS sunumlarından bazılarını veren Tom Petersen, XeSS temellerini inceliyor. Uzun lafın kısası, XeSS, Nvidia’nın tensör çekirdekleri yerine Intel’in derin öğrenme XMX çekirdekleriyle çalışmak üzere tasarlanmış olması dışında, Nvidia’nın DLSS’sinin yansıtılmış bir versiyonuna çok benziyor. Teknoloji, diğer GPU’larla da çalışabilir, ancak DP4a modunu kullanarak, bu onu AMD’nin FSR 2.0 yükselticisine ilginç bir alternatif haline getirebilir.
Intel tarafından gösterilen demolarda XeSS iyi çalışıyor gibi görünüyordu. Elbette, kaynak videonun gerçek içeriğin 1080p sıkıştırılmış versiyonu olduğunu kesin olarak söylemek zor, ancak ayrıntılı görüntü kalitesi karşılaştırmalarını başka bir zamana saklayacağız. Performans kazanımları, XeSS Performans modunu kullanırken bazı durumlarda %100’ün üzerinde bir kare hızı artışı ile DLSS ile gördüklerimize benzer görünüyor.
Nasıl çalışır
DLSS’nin nasıl çalıştığını zaten biliyorsanız, Intel’in çözümü büyük ölçüde aynıdır, ancak bazı küçük değişiklikler vardır. XeSS, video oyunlarında kare hızlarını artırmak için tasarlanmış, AI ile hızlandırılmış bir çözünürlük yükseltme algoritmasıdır.
Çoğu derin öğrenme algoritmasının ilk adımı olan eğitimle başlar. AI ağı, bir oyundan daha düşük çözünürlüklü örnek kareler alır ve bunları işleyerek, yükseltilmiş olması gereken çıktı görüntülerini üretir. Ardından ağ, sonuçları istenen hedef görüntüyle karşılaştırır ve herhangi bir “hatayı” denemek ve düzeltmek için ağırlık ayarlamalarını geriye doğru yayar. İlk başta, ortaya çıkan görüntüler çok iyi görünmeyecek, ancak AI algoritması yavaş yavaş hatalarından ders alıyor. Binlerce (veya daha fazla) eğitim görüntüsünden sonra, ağ sonunda istenen sonuçları “sihirli bir şekilde” üretecek ideal ağırlıklara yakınsar.
Algoritma, birçok farklı oyundan örnekler kullanarak tamamen eğitildikten sonra, teorik olarak herhangi bir video oyunundan herhangi bir görüntü girdisi alabilir ve neredeyse mükemmel bir şekilde yükseltebilir. DLSS’de (ve FSR 2.0) olduğu gibi, XeSS algoritması da kenar yumuşatma rolünü üstlenir ve geçici AA gibi klasik çözümlerin yerini alır.
Yine, şu ana kadar hiçbir şey özellikle dikkate değer değil. DLSS ve FSR 2.0 ve hatta standart zamansal AA algoritmaları, FSR ve TAA için AI öğeleri hariç, aynı temel işlevlerin çoğuna sahiptir. Oyunlar, XeSS’yi, tipik olarak ana oluşturma ve ilk efektler yapıldıktan sonra, ancak işlem sonrası efektler ve GUI/HUD öğeleri çizilmeden önce, oluşturma ardışık düzenlerine entegre edecektir. Bu şekilde, 3B oluşturmanın zor görevi daha düşük bir çözünürlükte çalıştırılırken kullanıcı arayüzü keskin kalır.
XeSS, Intel’in Arc XMX çekirdeklerinde çalışır, ancak diğer GPU’larda da biraz farklı bir modda çalışabilir. DP4a talimatları temel olarak tek bir 32-bit kayıt kullanılarak yapılan dört INT8 (8-bit tamsayı) hesaplamasıdır, tipik olarak bir GPU gölgelendirici çekirdeği aracılığıyla erişebileceğiniz şeye. Bu arada XMX çekirdekleri doğal olarak INT8’i destekler ve aynı anda 128 değer üzerinde çalışabilir.
Bu çok dengesiz görünebilir, ancak örnek olarak bir Arc A380, her biri aynı anda dört INT8 işlemi yapabilen 1024 shader çekirdeğine sahiptir. Alternatif olarak A380, her biri 128 INT8 işlemi yapabilen 128 MXM birimine sahiptir. Bu, MXM verimini DP4a veriminden dört kat daha hızlı yapar, ancak görünüşe göre DP4a modu, bir miktar XeSS iyiliği için hala yeterli olmalıdır.
DP4a’nın bir farklı eğitimli ağ, belki de hesaplama açısından daha az yoğun olan bir ağ. Bunun gerçek dünya performansına ve görüntü kalitesine nasıl dönüşeceği henüz belli değil ve görünüşe göre oyun geliştiricilerinin Arc olmayan GPU’ları desteklemek istiyorlarsa hem XMX hem de DP4a modları için desteği açıkça dahil etmeleri gerekecek gibi görünüyor.
Intel XeSS Performans Beklentileri
Intel, Shadow of the Tomb Raider’ın geliştirme yapısı ve özellikle XeSS için yapılmış yeni bir 3DMark karşılaştırması dahil olmak üzere XeSS çalıştıran birkaç oyun testi gösterdi. Ayrıca videonun sonunda Arcadegeddon, Redout II, Ghostwire Tokyo, The DioField Chronicle, Chivalry II, Naraka Bladepoint ve Super People’ın XeSS ile ve XeSS olmadan çalıştığından kısa klipler gösterildi.
Shadow of the Tomb Raider’da, ışın izlemeli gölgeler de dahil olmak üzere neredeyse maksimum ayarlarla 2560×1440’ta bir Arc A770 grafik kartında çalışan XeSS, Ultra Kalite ayarında yaklaşık %25’ten %100’e varan bir performans artışı sağladı. Performans ayarını kullanırken kare hızlarına Kalite ve Dengeli ayarlar orta bir zemine gider ve performansı sırasıyla yaklaşık %50 ve %75 oranında artırır.
Bu kazançlar doğal olarak oyun motoruna, ayarlara ve temel performansa göre değişecektir. Oyun ne kadar zorlu ve kare hızı ne kadar düşükse, XeSS muhtemelen o kadar faydalı olacaktır. Performans modunu kullanan Intel, 1440p’de %40 ila %110 arasında tipik kazançlar gösterirken, Dengeli mod yaklaşık %25 ila %75 arasında değişen iyileştirmeler sağladı.
3DMark ayrıca, Gelişmiş sürümü için, bir kıyaslama modu ve kullanıcıların görsel kalite farklılıklarını kontrol etmek için yakınlaştırma yaparak kıyaslama görüntülerine bakmalarına olanak tanıyan bir Çerçeve Denetçisi içeren bir Intel XeSS Özellik Testi ekleyecektir. Kullanımı Nvidia’nın ICAT yardımcı programından çok daha kolay görünüyor, ancak elbette tek bir sentetik kıyaslamadan çerçeveler sağlamakla da sınırlı.
3DMark, XeSS Özellik Testi için zorlu Port Royal ışın izleme sahnesini kullandığından, performans kazanımları özellikle etkileyici olabilir. Performans modunda XeSS ile 1440p’de kıyaslama, FPS’de %145, Dengeli modda %109, Kalite modunda %81 ve Ultra Kalite modunda %49 artış gördü.
Frame Inspector ayrıca, XeSS’nin görüntüyü çok iyi bir şekilde yeniden yapılandırmasıyla bazı iyi sonuçlar gösterdi; öyle ki Intel’den Tom Petersen, XeSS görüntüsünün aslında TAA ile yerelden daha iyi göründüğünü savunuyor. Tabii ki, bunu bir tuz tanesi ile almanız gerekiyor ve tek bir konserve diziden alınan görüntüler büyük olasılıkla gerçek dünyadaki oyun deneyimlerini tam olarak temsil etmeyecektir.
XeSS SDK ve 20’den Fazla Oyun Çalışmada
Intel, bir oyun motorunda XeSS’yi uygulamak için kullanımı kolay bir SDK sağlayacak. Arayüz ve gereksinimler, TAA uygulamalarının yanı sıra DLSS ve FSR 2.0’a çok benzer olacaktır, bu nedenle herhangi bir modern grafik motoru için nispeten kolay bir ekleme olmalıdır.
TAA, FSR 2.0 ve DLSS gibi, XeSS de geçerli kareyle birlikte hareket vektörlerine ihtiyaç duyar ve kendi önceki kareler koleksiyonunu tutar. Bunların tümü, sonuçta iyi bir sonuç elde etmek için AI ağına beslenir. XeSS ayrıca sahnedeki örtüşmeyi ortadan kaldırmaya yardımcı olmak için kamera titremesini kullanır.
Şu anda Intel’in önümüzdeki aylarda piyasaya sürülmesi planlanan XeSS’li 20’den fazla oyunu var. Bunlardan bazıları çatlaklardan geçebilir veya gecikebilir, ancak en azından yeni başlayanlar için iyi bir başlangıç. Aynı zamanda, AMD kısa süre önce FSR 2.0’ı ekleyen veya yakında ekleyecek olan sekiz oyun daha duyurdu ve Nvidia’nın DLSS 2.0 veya üstü ile gönderilen 100’den fazla oyunu var. Oyunculara en iyi algoritma seçimini sağlayacak olan üç alternatifi de eklemek isteyen kaç oyun geliştiricisi olacak? Pek çok oyunun olası yükseltme seçeneklerinden yalnızca birini veya ikisini destekleyeceğinden şüpheleniyoruz.
XeSS, Intel Arc Alchemist GPU’larını muhtemelen yakın bir gelecekte dünya çapında piyasaya sürdüğünde resmi olarak başlayacak. Arc A380 bu noktada etkin bir şekilde piyasaya sürüldü ve Intel şimdi A750 ve A770 ile dalga geçti. Umarım, çok uzak olmayan bir gelecekte hem MXM hem de DP4a modlarında XeSS’yi deneyimleyeceğiz. Şu anda, alım AMD ve Nvidia rekabetinin çok gerisinde kalıyor.