ne kurabiyesiarkasında bir yazılım geliştiricisi RPCS3çok platformlu açık kaynaklı bir Sony PlayStation 3 öykünücüsü, AVX-512 talimatlarını kullanan ve bir %30 performans artışı öykünücüye. Şimdiye kadar, AVX-512 talimatları oyunlar için pek mantıklı gelmedi. Ancak bir PS3 öykünücüsü söz konusu olduğunda, AVX-512 etkinleştirilmiş donanım, veri düzeyi paralelliği ve LLVM derleyicisinden oluşan büyük bir kayıt dosyası harikalar yaratabilir.
Ancak Whatcookie’nin ayrıntılı blog yazısında açıkladığı bir şey olan AVX-512 talimatlarının RPCS3 için nasıl anlamlı olduğuna geçmeden önce, bilişimin yakın tarihine kısa bir dalış yapalım.
Cell’i taklit etmeniz gerektiğinde, AVX-512 CPU’ların özelliği olan bir kombinasyon olan açık paralelliğe ve büyük dosya kayıtlarına ihtiyacınız vardır. Görünüşe göre, LVVM derleyicisi mümkün olan en iyi kod yolunu otomatik olarak seçer; bu, AVX-512 etkin donanım olması durumunda uygun bir kod yolu anlamına gelir. Açık nedenlerden dolayı (günün sonunda burada öykünme hakkında konuşuyoruz) tam olarak ideal değil, örneğin tüm maske kayıtları kullanılamaz.
AVX-512 ayrıca, isteğe bağlı olarak EVEX kodlu talimatlarla kullanılabilen yeni maske kayıtları da ekler,” diye yazdı Whatcookie. “Vektörler arasındaki bir karşılaştırmanın sonucu olarak maske kayıtlarında bir maske oluşturan yeni karşılaştırma talimatları var. Bir maske kaydı işlenen olarak kullanıldığında, maske tarafından seçilmeyen tüm öğeler ya sıfırlanacak ya da hedef kaydındaki mevcut değere dokunulmadan bırakılacaktır. k0 – k7 arasında 8 maske kaydı vardır, ancak k0 tüm öğeler seçilmiş gibi örtük olarak davrandığından, şeyleri maskelemek için yalnızca k1 – k7 kullanılabilir.
Bununla birlikte, rakamlar kendileri için konuşur. %30’luk bir performans artışı önemlidir. Bazıları, en iyi oyun CPU’muz Intel’in Alder Lake Core i9-12900K’da zaten saniyede 120 karenin oldukça üzerinde olduğumuz gerçeğini göz önünde bulundurarak bu tür bir optimizasyonla neden uğraştığımızı sorabilir? Cevap, bu optimizasyondan yararlanmaya devam edecek daha düşük güçlü makineler olacağıdır.
Sony, bir genel amaçlı Güç çekirdeği ve sekiz sinerjik işlem elemanı (SPE’ler), sipariş yürütme ve 128-bit SIMD organizasyonuna sahip tescilli bir komut seti mimarisi içeren Hücre CPU’ya dayalı PlayStation 3’ü tanıttığında, oyun endüstrisi tam olarak etkilenmedi. Cell, 2006’nın geleneksel işlemcilerinden çok farklı olduğundan. ).
İş parçacığı seviyesi (çok çekirdekli/çok iş parçacığı) ve veri seviyesi paralelliği (SIMD), yüksek performanslı bilgi işlem (HPC), veri merkezi, kodlama ve iş yüklerini şifreleme ve hatta oyunlar için son derece iyidir, ancak bazen bunlardan yararlanmaları zordur. Donanım tabanı, kod karmaşıklığı, maliyetler, pazara sunma süresi ve diğer birçok husus, piyasada bulunan her bir istemci tarafı CPU (veya GPU) inovasyonunu kullanacak yazılımların geliştirilmesine kaynak yatırımı yapmama kararlarını yönlendirir. Video oyunlarına yönelik bu yaklaşım yeterince iyi olarak kabul edilir; bu, hem Microsoft’un hem de Sony’nin geleneksel Radeon grafik mimarisine sahip x86’da (AVX2 ile, ancak AVX-512 olmadan) olmasının nedenlerinden biridir.