AMD’nin Strix Point “Ryzen AI 9 365” Zen 5 APU’sunun tarafından test edildiği bildirildi David HuangIPC, gecikme ve performansa ilişkin derinlemesine bir analize sahip olan.

AMD Ryzen AI 9 365 “Strix Point” APU, Lansmandan Önce Çok Sayıda Karşılaştırmada Test Ediliyor, Zen 5’in IPC’si, Performansı, Gecikmesi ve Daha Fazlası

Not – David Huang’ın blogu, burada belirtilen rakamların, AMD Strix Point APU’nun, özellikle de Ryzen AI 9 365’in mühendislik örneğine dayandığını belirtiyor; dolayısıyla, bunlar son ürünü temsil etmeyebileceğinden bunlara biraz ihtiyatlı yaklaşın. Ayrıca test sisteminin resmi olmayan sistem donanım yazılımı/yazılımını çalıştırdığını da açıkça belirtiyor.

Resim Kaynağı: David Huang’ın Blogu

Başlangıç ​​olarak David, Ryzen AI 9 365 SKU’ya sahip olduğu bildirilen eski bir AMD Strix Point dizüstü bilgisayarına erişim sağladı. Test platformunda 32 GB kapasitelerde LPDDR5x-7500 bellek kullanıldı. Bugünkü testin ana odak noktası, Zen 3, Zen 4 ve Zen 5 mimarileri de dahil olmak üzere üç nesil Zen CPU’nun talimat verimini/gecikmesini ölçmek için InstructionRate Aracıyla başlayan IPC ve Verim üzerindedir.

David, Zen 5’in temel tasarımı sayesinde iyileştirmelere sahip olduğunu ancak mimarinin birkaç dezavantajının da bulunduğunu belirtiyor:

  • Çeşitli skaler ALU talimatlarının verimi büyük ölçüde artırıldı, ancak mobil Zen 5’teki vektör birimlerinin sayısı masaüstü ve sunucuya kıyasla yarıya indirildiği için, bu testteki SIMD verimi Zen 4’e kıyasla değişmeden kalıyor. Zen 5’te bile yarıya indirilmiş vektör birimlerine sahip çekirdek, tüm genişliklerdeki SIMD depolama işlemleri önceki nesle kıyasla hala iki katına çıkar ve SIMD yük depolama verimi 1:1’e ulaşır;
  • Döngü başına işlenebilen alınmayan dalların sayısı ikiden üçe çıkarılarak dal işleme kapasitesi büyük ölçüde geliştirildi. ve döngü başına alınan iki dal işlenebilir. Bunun yeni ön uç tasarımıyla ilgili olması gerekir;
  • 128/256/512bit SSE/AVX/AVX512 SIMD tamsayı toplama hesaplamalarının gecikmesi 2 döngüye çıkarıldı. Bu değişiklik yüksek frekansları korumayı kolaylaştırmak için olabilir.
  • 128/256bit SIMD tamsayı ekleme işlemlerinin verimi Zen 4’e kıyasla yarı yarıya azalır, ancak 512bit değişmeden kalır. Bu sorunun yalnızca yarıya bölünmüş SIMD’ye sahip Zen 5 çekirdeklerinde mevcut olduğu ve bunun da bağlantı noktası tahsisiyle ilgili olabileceği tahmin ediliyor;
  • Zen 4’te sunulan nop fusion özelliği kaldırıldı. Aynı makro-işlemde bir nop talimatını başka bir talimatla birleştirmek artık mümkün değildir;
  • Bazı mantıksal kayıt işlemlerinin verimi ayarlandı, bazı mov işlemlerinin ve bazı kayıt sıfırlama işlemlerinin verimi 5’e birleştirildi; bu, Zen 4’e kıyasla karışık bir gelişmedir.

Testler ayrıca talimat getirme, kod çözme ve makro işlem önbelleğini etkilemesi gereken Paralel çift boru ön ucuna da odaklanıyor. Farklı uzunluk ve sayıdaki NOP komutlarının çalıştırılmasıyla Zen 4 ile Zen 5 arasındaki farkların gözlemlenebileceği belirtiliyor. Gözlemler şu şekilde sonuçlanıyor:

  • Zen 5, Tremont’a benzer ancak daha geniş bir çoklu ön uç tasarımı kullanıyor; 8 genişlikte yeniden adlandırma uygulamak için iki adet 4 genişlikte x86 kod çözücü ve en az 8 genişlikte makro işlem önbelleği kullanıyor;
  • Aşağıdaki olguyu göz önünde bulundurun
    • Zen 5, tek bir iş parçacığında ardışık NOP talimatlarını çalıştırırken x86 kod çözme bant genişliğinin 4’ü aşmasını sağlayamaz;
    • Komut çıktısı bölümünde alınan iki dalın tek bir döngüde işlenebileceği test edildi;
  • Zen 5’in Gracemont’a benzer bir kod çözme öncesi ILD önbellek çözümü kullanmadığını, ancak dal tahmincisi alınan bir dalı tahmin ettiğinde iki kod çözücünün aynı anda çalışmasına izin vermesi gerektiğini, yani kod çözücülerden birinin kod çözücülerden birinin kod çözmeye başlamasına doğrudan izin vermesi gerektiğini tahmin etmek mantıklıdır. bir sonraki şubenin hedef adresinden. Bu açıdan bakıldığında AMD’nin seyrek dallara sahip senaryolarda yüksek verim elde etmek için makro-op önbelleğine güvenmeye ihtiyacı var.
  • Zen 5, yalnızca aynı döngüde iki konumdan x86 talimatlarının kodunun çözülmesini desteklemekle kalmıyor, aynı zamanda makro işlem kapsamı dahilinde döngü başına iki alınan dal elde etmek için aynı döngüde makro işlem önbelleğindeki iki konumdan talimatların getirilmesini de destekliyor gizlenmiş;
  • Çekirdek iki SMT iş parçacığını çalıştırdığında, her biri bir kod çözücüyü tekeline alabilir, böylece tüm çekirdeğin x86 kod çözme çıkış limiti çoğu durumda 8’e ulaşır.
amd-ryzen-ai-9-365-zen-5-strix-point-apu-_-ipc-gecikme-bant genişliği-verim-performans-testleri-_7
amd-ryzen-ai-9-365-zen-5-strix-point-apu-_-ipc-gecikme-bant genişliği-verim-performans-testleri-_8

Testler daha sonra AMD Strix Point APU’ların daha fazla performans yönüne geçiyor. Bir kez daha Ryzen AI 9 365 yongası kullanılıyor ancak bu sefer Ryzen 7 7735U (Zen 3), Ryzen 7 7840U (Zen 4) ve yukarıda adı geçen Ryzen AI 9 365 (Zen 5) ile karşılaştırılıyor, ancak bu sefer test edilen çipte hem Zen 5 hem de Zen 5C çekirdekleri mevcut. Zen 5C çekirdekleri yalnızca 3,30 GHz gibi çok daha düşük bir saat hızında çalışırken, Zen 5 çekirdekleri ve diğer iki çip 4,8 GHz sabit saat hızına ayarlanmıştır.

Performans SPEC CPU 2017 ve Geekbench 6 (tek çekirdekli ve çok çekirdekli) kapsamında değerlendirildi. SPEC CPU 2017’de AMD Zen 5 çipi, Zen 4 teklifine göre +%9,71, Zen 3 teklifine göre ise %22,28 artış kaydetti. Zen 5C çekirdekleri daha düşük saat hızlarında neredeyse Zen 4 IPC ile eşleşiyor.

amd-ryzen-ai-9-365-zen-5-strix-point-apu-_-ipc-gecikme-bant genişliği-verim-performans-testleri-_11
amd-ryzen-ai-9-365-zen-5-strix-point-apu-_-ipc-gecikme-bant genişliği-verim-performans-testleri-_10

Geekbench 6’da Zen 3’e göre göreceli performans artışı Zen 3 ve Zen 4’e göre %40,94’e kadar çıkıyor, yaklaşık %13,1. Bu sayılar yalnızca tek çekirdeklidir. Çok çekirdekli testlerde, Zen 5 “Strix Point” APU’ları Zen 3’e göre %55,45’lik bir artış ve Zen 4’e göre %24,3’lük bir iyileşme görüyor ancak Zen 3 ve Zen 4 yongalarının 54W’a kıyasla 28W TDP çalıştırdığını da unutmamak gerekiyor. Ryzen AI 9 365 APU’su.

SPEC CPU 2017 IPC (Nesilden Nesile)

  • Zen 3 – %100,00
  • Zen 4 – %111,46
  • Zen 5 – %109,71

SPEC CPU 2017 Performansı (Göreceli)

  • Zen 3 – %100,00
  • Zen 4 – %111,46
  • Zen 5 – %122,28

Geekbench 6 ST IPC (Nesilden Nesile)

  • Zen 3 – %100,00
  • Zen 4 – %117,37
  • Zen 5 – %115,28

Geekbench 6 ST Performansı (Göreceli)

  • Zen 3 – %100,00
  • Zen 4 – %124,71
  • Zen 5 – %140,94

David’in blog yazısı kapsamlı bir şekilde Zen 5 mimarisinin çeşitli mimari yönlerine değiniyor Bu yalnızca Ryzen AI 300 “Strix Point” APU’larına güç vermekle kalmayacak, aynı zamanda Ryzen 9000 “Granite Ridge” Masaüstü ailesi, 5. Nesil EPYC “Turin” Sunucu ailesi ve masaüstü ve dizüstü bilgisayar platformlarına yönelik diğer çeşitli APU’lar gibi birçok farklı CPU’ya da güç sağlayacak. .

Resmi olarak bildiğimiz şey, Zen 5 çekirdeklerinin ortalama %16’lık bir IPC artışıyla geldiği ve farklı iş yüklerine göre değiştiğidir, bu nedenle okuyucularımıza bir kez daha bu sonuçlara biraz ihtiyatlı yaklaşmalarını tavsiye ediyoruz. Zen 5’in ilk lansmanının Temmuz ayı ortasında Strix APU’larla, ardından Temmuz ayı sonlarında Ryzen 9000 yüksek performanslı masaüstü yongalarının piyasaya sürülmesi bekleniyor; daha fazla bilgi için bizi takip etmeye devam edin.

Haber kaynağı: David Huang

Bu hikayeyi paylaş

Facebook

heyecan



genel-17