Intel yeni APX’ini yayınladı (Gelişmiş Performans Uzantıları) bugün ve ayrıca yeni AVX10’u açıkladı [PDF] bu, ilk kez hem P-Çekirdeklere hem de E-Çekirdeklere AVX-512 yetenekleri için birleşik destek getirecek. AVX talimat setinin bu evrimi, Intel’in Alder ve Raptor Lake işlemcilerde bulunan yeni x86 hibrit mimarisiyle karşılaştığı ciddi sorunlardan kaçınmasına yardımcı olacaktır.
Bununla birlikte, yeni AVX10 ISA, Intel’in mevcut nesil CPU’ları ile desteklenmeyecek – gelecekteki yongalara ulaşması planlanıyor. Intel, AVX10’un hem tüketici hem de sunucu işlemcileri için gelecekte tercih edilen vektör ISA olacağını söylüyor.
Intel AVX10 (Gelişmiş Yönerge Uzantıları 10)
En temel düzeyde AVX10, Intel’in hem E-çekirdeği hem de P-çekirdeği olan yongalarının AVX-512’yi desteklemesine izin verecek, ancak 512-bit yönergeler yalnızca P-çekirdeklerinde çalışabilir. Bu arada, birleştirilmiş 256-bit AVX10 yönergeleri, p-çekirdekleri veya e-çekirdekleri üzerinde çalışabilir, böylece tam çipin AVX-512 özelliklerini desteklemeye devam etmesine izin verir.
Bu nedenle Intel, hem Alder Lake hem de Raptor Lake için AVX-512’yi devre dışı bıraktığında yaptığı gibi 512 bit vektör desteğini devre dışı bırakmak zorunda kalmayacak.
Daha derine inecek olursak, AVX10 (Advanced Instruction Extensions 10) ISA, AVX-512’nin bir üst kümesidir ve hem 256 bit hem de 512 bit vektör kayıt boyutuna sahip işlemciler için AVX-512 ISA’nın tüm özelliklerine sahiptir.
Birleştirilmiş AVX10 ISA, “AVX512VL özellik bayrağına sahip AVX-512 vektör yönergeleri, maksimum 256 bit vektör kayıt uzunluğu, ayrıca sekiz 32 bit maske kaydı ve gömülü yuvarlamayı destekleyen 256 bit talimatların yeni sürümlerini” içerecektir ve bu sürüm hem p-çekirdeklerde hem de e-çekirdeklerde çalışacaktır.
Bununla birlikte, e-çekirdekler, birleştirilmiş AVX10’un maksimum 256-bit vektör uzunluğu ile sınırlı olurken, P-çekirdekleri 512-bit vektörleri kullanabilir. Bu, Arm’ın SVE ile değişken vektör genişlikleri desteğine benziyor.
Intel, mevcut uygulamaların en azından aynı vektör uzunluklarında AVX-512 ile sağladıkları performansın aynısını AVX10 ile sağlayacağını söylüyor. Intel ayrıca şunları iddia ediyor:
- Intel AVX10’a yeniden derlenen Intel AVX2 ile derlenen uygulamalar, ek yazılım ayarlamasına gerek kalmadan performans kazanımları gerçekleştirmelidir.
- Vektör yazmaç baskısına duyarlı Intel AVX2 uygulamaları, 16 ek vektör yazmaç ve yeni yönergeler sayesinde en yüksek performansı elde edecektir.
- Yüksek iş parçacıklı vektörleştirilebilir uygulamalar, E-çekirdek tabanlı Intel Xeon işlemcilerde veya performans hibrit mimarisine sahip Intel ürünlerinde çalışırken daha yüksek toplu iş hacmi elde edecektir.
Intel, altıncı nesil Xeon “Granite Rapids” yongalarından başlayarak AVX10 sürüm 1’i (AVX10.1) destekleyecektir, ancak bu nesil, yeni birleştirilmiş 256 bit vektör yönergelerini değil, yalnızca 512 bit vektör yönergelerini destekleyecektir. Bunun yerine, bu ilk nesil, AVX-512’den AVX10’a geçiş çipi olarak görev yapacak.
Granite Rapids’den sonra gelen çipler, yakınsanmış 256 bit vektör uzunlukları için destek ekleyen AVX10.2’yi ve yeni AI veri türleri ve dönüştürmeleri, veri taşıma optimizasyonları ve standart desteği gibi diğer yeni özellikleri destekleyecektir. Gelecekteki tüm Xeon işlemcileri, eski uygulamaların normal şekilde çalışmasını sağlamak için tüm AVX-512 talimatlarını tam olarak desteklemeye devam edecektir.
Geliştirici geri bildirimlerini (açıkça olumsuz) ele almak için Intel, AVX-512’ye kıyasla AVX10 numaralandırma yöntemlerini önemli ölçüde basitleştirmeyi de planlıyor. Intel ayrıca, yeni bir AVX10 revizyonuna yapılan her geçişin, bir değişikliği hak edecek kadar yeni talimatlara ve yeteneklere sahip olmasını sağlamayı, böylece sürüm ve numaralandırma şişkinliğini azaltmayı planlıyor.
Intel, AVX10 piyasaya çıktığında AVX-512 ISA’yı donduracak ve AVX-512 yönergelerinin gelecekteki tüm kullanımları AVX10 ISA aracılığıyla gerçekleşecek. Bu arada, yeni AMX etkilenmeyecek.
Intel APX (Gelişmiş Performans Uzantıları)
Intel ayrıca bugün yeni APX’i (Gelişmiş Performans Uzantıları) duyurdu (eski tarz iAPX 432 ile karıştırılmamalıdır).
Intel, APX ile derlenen kodun, Intel 64 temeli için derlenen aynı koddan %10 daha az yük ve %20 daha az depo içerdiğini iddia ediyor. Intel ayrıca, kayıt erişimlerinin hem daha hızlı olduğunu hem de karmaşık yükleme ve depolama işlemlerine göre önemli ölçüde daha az dinamik güç tükettiğini söylüyor. İlginç bir şekilde, yeni APX, Intel 2019’da MPX’i terk ettiğinde kullanılmayan 128B alanı için yeni bir kullanım alanı buluyor ve onu XSAVE için yeniden amaçlıyor.
İşte APX’in üst düzey özellikleri:
- Bu belgede Genişletilmiş GPR’ler (EGPR’ler) olarak da adlandırılan 16 ek genel amaçlı kayıt (GPR’ler) R16–R31
- Birçok tamsayı talimatı için yeni bir veri hedefi (NDD) kaydı olan üç işlenenli talimat biçimleri
- Koşullu ISA geliştirmeleri: Yeni koşullu yükleme, saklama ve karşılaştırma yönergeleri, derleyici için ortak yönergelerin durum bayraklarının yazılmasını engelleme seçeneğiyle birleştirildi
- Optimize edilmiş kayıt durumu kaydetme/geri yükleme işlemleri
- Yeni bir 64 bit mutlak doğrudan atlama talimatı
Intel, APX’i CPU çekirdeğinin silikon alanını veya güç tüketimini etkilemeyecek şekilde uyguladığını iddia ediyor. Yapabilirsiniz APX hakkında daha fazlasını buradan okuyunve Intel, bağlantılı sayfanın alt kısmında hem APX hem de AVX10 için bir kaynak listesine sahiptir.
APX ve AVX10, Intel’in yakın zamanda yaptığı duyurunun hemen ardından geldi. Intel 64 mimarisini zayıflatmayı araştırmak x86S adlı basitleştirilmiş bir x86 sürümüne.