AMD, Hot Chips’te bir sonraki yüksek performanslı bilgisayar yolculuğuna güç verecek yepyeni Zen 5 çekirdek mimarisine derinlemesine bir bakış sunuyor.

Zen 5 Çekirdek Mimarisine Derinlemesine Bir Bakış: AMD’nin Yeni Nesil Yüksek Performanslı Bilgi İşlem Mimarisi

AMD’nin Zen 1 çekirdek mimarisi ilk olarak 2017’de piyasaya sürüldü ve o zamandan beri şirket beş yeni mimariyi (Zen+, Zen 2, Zen 3, Zen 4, Zen 5) tanıttı. AMD on yıla, 7nm/6nm işlem teknolojilerini kullanırken %19 IPC iyileştirmesi, 8 çekirdekli bir kompleks ve CCX başına L3 önbelleklerini artıran Zen 3 mimarisini piyasaya sürerek başladı.

Şirket bunu Zen 4 sürümüyle takip ederek %14’lük bir IPC iyileştirmesi daha getirdi, AVX-512 (FP-256) talimatları, L2 önbelleğini iki katına çıkararak 1 MB’a çıkardı, VNNI/BFLOAT16 desteği ve 5nm ve 4nm işlem teknolojisini salladı.

Bu yıl AMD, AVX-512 ve FP-512 çeşitleri, 8 geniş dağıtım, 6 ALU, Çift boru getirme/kod çözme ve 4nm/ 3nm teknolojisi kullanımı. Bugün AMD, Hot Chips’te Zen 5’in tüm mimarisini derinlemesine inceliyor.

AMD, Zen 5’in tasarım hedeflerini belirterek başlıyor. Performans açısından Zen 5, bir başka büyük 1T ve NT performansı artışı, dengeli çapraz çekirdek 1T/NT talimatı ve veri çıkışı sağlamayı, ön uç paralelliği yaratmayı, yürütme paralelliğini artırmayı hedefliyor , yüksek verim, verimli veri taşıma ve önceden getirme ve verim ve yapay zeka artışları için AVX512/FP512 veri yollarını destekler. Eş zamanlı olarak AMD, Zen 5 ve Zen 5C çekirdek çeşitleriyle genişletilmiş platform desteğinin yanı sıra ek ISA uzantıları ve yeni güvenlik özellikleri gibi yeni yetenekler de eklemek istiyor.

Aşağıda AMD’nin Zen 5 çekirdek mimarisine genel bir bakış yer almaktadır:

2 Konu/Çekirdek

NextGen Şube Tahmincisi

Önbellekler:

  • I-Cache: 32KB, 8 yollu; 2x32B getir/döndür
  • İşlem önbelleği: 6K dahili; 2x 6 genişlikte getirme/döndürme
  • D-Önbellek: 48KB, 12 yollu; 4mem işlem/döngü
  • L2-Önbellek: 1 MB, 16 yollu

Çift I-Fetch/kod çözme boruları, 4 giriş/boru

Tam sayıya veya FP’ye gönderilen 8 işlem/döngü

Yürütme yetenekleri:

  • 6 Tamsayı ALU
  • 4 AGU, döngü başına LS’ye 4 adres
  • 4 FP işlem/döngü; 2 döngü FADD

TLB’ler:

  • L1: 64 giriş ITLB, 96 giriş DTLB
  • L2: 2K ITLB 4K DTLB 1G hariç her şey

Dengeli bir verim sağlamak için Zen 5’in sunduklarına gelince, şunlara bakıyorsunuz:

Ön Uç paralelliği:

  • Döngü başına 2 tahmini token dalı
  • 2x Op boru kapakları
  • 2x boruları getir/şifre çöz talimatı
  • 8 geniş dağıtım

Uygulamak:

  • Tamsayı: 6ALU, 4AGU adresleri->LS
  • FPU: tam 512b AVX512 veri yolları
  • FPU: 4 yürütme borusu

Veri akışı:

  • 4 yük borusu 2, 512b AVX512 boruyu destekler
  • 48K, 12 yollu L1D önbellek, döngü başına 4 not sunar
  • 2x genişlikte L2 önbellek L1I ve L1D önbellekler

Getirme Gelişmeleri açısından AMD’nin Zen 5 çekirdek mimarisi şunları sunar:

Dal Tahmini: daha az kabarcık, daha fazla doğruluk ve verim

  • Sıfır kabarcık koşullu dallar
  • L2 boyutlu (16K) L1 BTB ve daha büyük TAGE
  • Daha büyük dönüş adresleri yığını (52 giriş)
  • 2 alınan tahmin/döngü

Bellek yönetimi:

  • Agresif getirme, L2 ve masa yürüyüşü gecikmelerini gizler
  • 4x L2 ITLB (2048 girişi)

Icache gecikmesi ve bant genişliği

  • 64B/döngü getirme
  • 2 akışları getir ifadesi

Kod Çözme Gelişmeleri açısından AMD’nin Zen 5 çekirdek mimarisi şunları sunar:

Opcache: daha fazla kapsama alanı ve verim ile daha yüksek yoğunluk

  • %33 daha fazla giriş ilişkilendirilebilirliği (16 yönlü)
  • Yoğun girişler, operasyonları değil, 6 talimatı veya birleştirilmiş talimatları saklar
  • 2 OC boru x 6 giriş/boru -> 12 kurulum/döngü

Çift Kod Çözme Boruları

  • 2 boru paralel bağımsız talimat akışlarını/temel blokları destekler
  • Boru başına 4 adım/döngü verimi
  • SMT modu her iş parçacığına bir boru verir

Int ve FP yürütmeye 8 geniş dağıtım

Uygulama Gelişmeleri açısından AMD’nin Zen 5 çekirdek mimarisi şunları sunar:

8 geniş dağıtım, yeniden adlandırma, kullanımdan kaldırma

Tamsayı zamanlayıcı ilerlemeleri

  • Yaş matrisiyle birleştirilmiş
  • Daha fazla simetri, seçimi basitleştirme

3 çarpanlı 6 ALU, 3 şube birimi

4 AGU, döngü başına 4 bellek adresiyle daha geniş bir LS’yi besler

Yürütme aralığı büyümesi

  • Zamanlayıcı büyümesi
  • 240 girişli fiziksel kayıt dosyası
  • ROB/kuyruk sökücü 448/224 1T/2T girişleri

AMD ayrıca büyük FP değişiklikleri yaptı ve tam 512b veri yoluna sahip yukarıda bahsedilen AVX 512 gibi yeni özellikler ekledi. Zen 5, 4 adet 1 işlem/döngü yürütme işlem hattı, 2 LS/tamsayı kayıt işlem hattı, 2 512b yük/döngü, 1 512b depolama/döngü ve 2 döngü FADD ile daha fazla bant genişliği ve daha az gecikme sunar. Yürütme penceresi ayrıca 3 daha büyük zamanlayıcıda (1/boru çifti) 8 geniş dağıtımla genişletildi ve fiziksel kayıt dosyası iki katına çıktı.

Son olarak, aşağıdakileri içeren Yükleme ve Depolama ilerlemelerine sahibiz:

48KB 12 yollu L1D, 4 döngülü yük kullanımını korur

Daha Fazla Bant Genişliği

  • Döngü başına 4 yük/2 depo karışımı için 4 LS boru
  • 4 Tamsayılı yük borusu 2, 512b AVX512 borularını destekler
  • Döngü başına 2 mağaza taahhüdü
  • L2 DCache’den/L2 DCache’ye 64B doldurma/kurban
  • Dize Mağazası optimizasyonları – hedef bellek okumasını ortadan kaldırır, Mağaza bloğun üzerine yazacaksa bant genişliğini serbest bırakır

Daha Büyük Uçuş İçi Pencere

  • Yükleme ve Depolama kuyruğunun büyümesi
  • Tampon büyümesini birleştiren mağaza
  • Daha fazla uçuş sırasında ıskalama (ölçeklenebilir izleme)
  • Ölçeklenebilir yük sıralama kuyruğu

Verilerin önceden getirilmesi

  • Yeni 2D adım önceden getirici aynı zamanda akış ve bölge önceden getiricilerini de geliştirir
  • İş yükü modeli tanımayı genişletir

Önbelleğe geçtiğimizde Zen 5, L1 ve L1D’ye 64B/clk ile 2 kat L2/çekirdek arayüz bant genişliği ve L1D’den 2 kat L2 ilişkilendirilebilirliği (şu anda 16 yollu ve 3,5 daha az döngü yapan) ile bazı yükseltmeler gördü. daha fazla L3 uçuş sırasındaki kayıplar ve yapılandırmalar arasında 32/16 MB L3 (Zen 5 / Zen 5C), çekirdek başına 4 MB (Zen 5) ve çekirdek başına 2 MB (Zen 5C) yer alıyor.

İki konfigürasyondan bahsederken, Zen 5 çekirdeği en yüksek 1T performansı için optimize edilirken, Zen 5C çekirdeği performans/w ve performans/alan optimizasyonlu platformları hedefliyor. Hem Zen 5 hem de Zen 5C, aşağıdakileri içeren aynı ISA’yı kullanır:

Güç verimliliği iyileştirmeleri için AMD, Zen 5’i sıfırdan geliştirdi ve güç geçiş iyileştirmeleri ile 2T desteğini (önemli pref/watt avantajları) geliştirmeye devam ediyor. Zen 5 mimarisi aynı zamanda azaltılmış güç durumu giriş/çıkış sürelerine, israfı ortadan kaldırmak için daha iyi dallanma tahminine sahiptir ve ayrıca dize işlemleri optimizasyonları ve önceden getirici etkinliği ve verimlilikleri yoluyla veri yolu, önbellek ve çekirdekler arası trafiği ortadan kaldırarak işlemleri optimize eder.

Aşağıda Zen 5’e karşı Zen 4’te kaydedilen önemli ilerlemeler yer almaktadır:

AMD aynı zamanda iki kat L2 ilişkilendirilebilirliği, iki kat L2 bant genişliği, 320 L3 uçuş sırasında ıskalayan düşük gecikmeli L3, hızlı ve özel bir L2 önbellek (1 MB), L3’ün tüm platformlar arasında paylaşıldığı Zen 5 çekirdek kompleksinin hızlarını ve beslemelerini de paylaşıyor. kompleksteki tüm çekirdekler, L3, L2 kurbanlarından doldurulmuştur ve prob filtreleme ve hızlı önbellek aktarımı için L3’te çoğaltılmış L2 etiketleri.

Ürünlerden bahsederken, AMD’nin Zen 5 çekirdek kompleksleri veya CCX’leri üç ürün serisinde ilk olarak öne çıkacak. Bunlar arasında Ryzen 9000 “Granite Ridge” Masaüstü CPU’ları, Ryzen AI 300 “Strix” Dizüstü Bilgisayar CPU’ları ve 5. Nesil EPYC “Turin” Veri Merkezi CPU’ları yer alıyor.

AMD, Zen 5’e yeni başladı, dolayısıyla şirket PC’ler ve sunucular için mimaride ince ayarlar yaparken gelecekte daha da fazla ürün bekleyebiliriz.

Bu hikayeyi paylaş

Facebook

heyecan



genel-17