Linux kıyaslama web sitesi Phoronix AVX-512 talimatlarıyla ne kadar hızlı çalıştığını görmek için Intel’in 5. Nesil Xeon Emerald Rapids ölçeklenebilir CPU’sunu test etti ve sonuç, ortalama performansın iki katına çıkmasıydı. Hatta bazı iş yüklerinde, güç tüketimini önemli ölçüde artırmadan performansın on kattan fazla arttığı görüldü.
Phoronix, testlerini Intel’in iki üst seviye Xeon Platinum 8592+ 64 çekirdekli CPU’su, 1 TB DDR5 belleği, 3 TB SSD’si olan ve Ubuntu Linux dağıtımıyla Intel Eagle Stream üzerinde çalışan bir sunucu kullanarak gerçekleştirdi. Yayın, Embree, OpenVKL ve Y-Cruncher gibi çeşitli iş yüklerini karşılaştırdı ve AVX-512’nin ortalama performansını iki katına çıkarmasını sağladı.
Bu ortalamanın büyük bir kısmı, Phoronix’in farklı parametrelerle defalarca test ettiği OpenVINO’daki performans sonuçlarına dayanıyordu. AVX-512 ile yapılan OpenVINO çalışmalarının çoğu, en az iki kat performans artışı gösterdi; en hızlı sonuç ise on kattan fazla daha hızlıydı. Bu öncelikle AI iş yükleri için özellikle yararlı olan AVX-VNNI ve BF16’yı destekleyen OpenVINO sayesindedir. AVX-512 etkinleştirildiğinde ve devre dışı bırakıldığında tepe frekansındaki fark minimum düzeydeydi. AVX-512 kapalıyken 3,01 GHz’e kıyasla Xeon Platinum 8592+ tüm çekirdeklerde 2,95 GHz’e ulaştı. 64 çekirdekli Emerald Rapids çipi, AVX-512’nin açık veya kapalı olmasına bakılmaksızın 3,9 GHz artırma saatine ulaştı.
Ortalama olarak güç kullanımı AVX-512 olsa da olmasa da değişmedi, ancak birçok bireysel iş yükü %10’a kadar daha fazla güç gerektiriyordu. Maksimum güç tüketimi yaklaşık 120 watt daha yüksekti; bu, ödün vermeden ücretsiz performans elde etmenin zor olduğu göz önüne alındığında oldukça tipik bir durum. Bu daha yüksek güç çekişi aynı zamanda biraz daha yüksek sıcaklıklar anlamına da geliyordu. Ayrıca AVX-512’yi açmak frekansı biraz düşürdü; bu da daha yüksek güç tüketiminden ve daha yüksek sıcaklıklardan kaynaklanabilir.
Çok çeşitli AVX-512 komutlarına yönelik destek, Emerald Rapids’in başlıca satış noktasıdır. Emerald Rapids incelememizde görüldüğü gibi CPU, ham performansta AMD’nin 96 çekirdekli 4. Nesil EPYC Cenova çipine kaptırsa da AVX talimatları, özellikle yapay zeka açısından Intel ve AMD’nin sunucu CPU’ları arasındaki dinamiği değiştirebilir. Microsoft’un, AMD’nin MI300X GPU’larıyla eşleştirmek için EPYC yerine son nesil Sapphire Rapids yongalarını seçmesinin olası nedenlerinden biri de bu.