AMD, 3D V-Cache’li üçüncü nesil EPYC 7003 “Milan-X” işlemci serisini bugün tam olarak tanıttı ve dünyanın 3D yığınlı önbelleğe sahip ilk yongalarının genel kullanıma sunulduğunu ve böylece L3 önbellek miktarını üç katına çıkardığını duyurdu. çip başına. AMD, yeni yongaların, bir zamanlar düşünülemez olan 768 MB L3 önbelleğe sahip 8.800 $’lık 64 çekirdekli 128 iş parçacıklı EPYC 7773X tarafından yönetilen belirli teknik bilgi işlem iş yüklerinde %88’e varan performans artışı sunduğunu iddia ediyor. Bu, iki yuvalı bir sunucunun artık 1,5 gigabayta kadar L3 önbelleği barındırabileceği anlamına gelir. AMD ayrıca, önümüzdeki ay tüketici odaklı Ryzen 7 5800X3D yongalarına gelecek olan 3D V-Cache teknolojisiyle ilgili birkaç yeni ayrıntıyı da açıkladı.
AMD, Milan-X işlemcilerini hiper ölçekleyicilere, OEM’lere ve SI’lara zaten gönderdi. Ek olarak Microsoft, Microsoft Azure’da zaten mevcut olan Milan-X HBv3 VM’lerinden çok sayıda kıyaslama paylaştı ve AMD’nin performans iddialarını büyük ölçüde doğruladı.
Bugün yeni olan çipler için fiyatlandırmadır ve aşağıda, çiplerin 64 çekirdekli EPYC 7773X için 910 $ (%11,5) artıştan 16 çekirdek için 2.620 $ (+167) artışa kadar değişen bir artışla geldiğini görebiliriz. EPYC 7373X, en azından standart genel amaçlı modellerle karşılaştırıldığında. Ancak Milan-X, yüksek performans segmentini hedefler, bu nedenle frekans optimizasyonlu “F” serisi Milan yongaları daha iyi karşılaştırılabilir. Burada Milan-X’in bu parçalardan kabaca %20 daha pahalı olduğunu görüyoruz.
Intel’in doğrudan karşılaştırılabilir herhangi bir Xeon modeli yok, ancak bu, HBM2E’li Sapphire Rapids yongaları bu yılın sonlarında geldiğinde değişecek. Intel, bu çiplerin bazı iş yüklerinde Milan-X’ten iki kat daha hızlı olacağını iddia ediyor. Doğal olarak, bunun laboratuvarlarımızda nasıl oynandığını görmemiz gerekecek.
AMD EPYC 7003 Milan-X Teknik Özellikleri ve Fiyatlandırması
İşlemci | Fiyat (1KU) | Çekirdek/İş parçacığı | Baz/Yükseltme Saati (GHz) | L3 Önbellek (L3 + 3D V-Önbellek) | TDP | cTDP (W) |
EPYC 7773X | 8.800 dolar | 64 / 128 | 2.2 / 3.5 | 768MB | 280W | 225-280W |
EPYC 7763 | 7.890 $ | 64 / 128 | 2.45 / 3.5 | 256MB | 280W | 225-280W |
EPYC 7573X | $5,950 | 32 / 64 | 2.8 / 3.6 | 768MB | 280W | 225-280W |
EPYC 7543 | 3.761 $ | 32 / 64 | 2.8 / 3.7 | 256MB | 225W | 225-240W |
EPYC 7F53 | $4.860 | 32 / 64 | 2.95 / 4.0 | 256MB | 280W | |
EPYC 7473X | 3.900$ | 24 / 48 | 2.8 / 3.7 | 768MB | 240W | 225-280W |
EPYC 7443 | 2.010$ | 24 / 48 | 2.85 / 4.0 | 128MB | 200W | 165-200W |
EPYC 74F3 | 2.900$ | 24 / 48 | 3.2 / 4.0 | 256MB | 240W | |
EPYC 7373X | $4.185 | 16 / 32 | 3,05 / 3,8 | 768MB | 240W | 225-280W |
EPYC 7343 | 1.565$ | 16 / 32 | 3.2 / 3.9 | 128MB | 190W | 165-200W |
EPYC 73F3 | 3.521 $ | 16 / 32 | 3.5 / 4.0 | 256MB | 240W |
Gerekli BIOS güncellemesinden sonra, bu yongalar SP3 soketi ile mevcut sunuculara düşer. 3D V-Cache teknolojisi, bazı iş yüklerinde çarpıcı performans iyileştirmeleri sağlayabilir, ancak bu kazanımlar her uygulama türü için geçerli değildir. Bu nedenle, AMD’nin ‘X’ son ekiyle gösterilen sınırlı dört çip seçimi, belirli teknik iş yükü gereksinimlerini karşılamak için özenle seçilmiş çekirdek sayımlarını temsil eder.
3D V-Cache’den en fazla yararlanan iş yükleri, L3 önbellek kapasitesine duyarlı olma, yüksek L3 önbellek kapasitesi eksiklerine (veriler önbellek için çok büyük) veya L3 önbellek çakışma kayıplarına (önbelleğe alınmış verilerin ilişkilendirilebilirliği düşük) sahip olma eğilimindedir. Fayda sağlama olasılığı en düşük olan iş yükleri, yüksek önbellek isabet oranlarına, yüksek L3 önbellek tutarlılık eksikliklerine (veriler sıklıkla çekirdekler arasında paylaşılır) veya önbelleğe alınmış verileri (tekrar tekrar yerine) yalnızca bir kez kullanma eğilimindedir.
Dört Milan-X modelinin tümü, daha küçük SKU’larda bile tam 768 MB L3 önbellek sağlamak için sekiz aktif çekirdek hesaplama kalıbı (CCD) ile donatılmıştır. Bu, her çekirdeğin 96MB’lık L3 önbelleğin tamamına erişimi olduğu düşünüldüğünde mantıklıdır, bu nedenle en düşük seviye 16 çekirdekli model bile yoğun paralelleştirmeye dayanmayan uygulamalar için önbellekten tam olarak yararlanabilir.
Artan önbellek ve bu tür tasarımla ilişkili termal/güç zorlukları nedeniyle bazı saat hızı değiş tokuşları bekliyoruz, ancak standart genel amaçlı EPYC modellerine kıyasla etki oldukça sessiz. Örneğin, EPYC 77373X, 250 MHz daha düşük temel saat hızına sahiptir, ancak 7763 ile karşılaştırıldığında aynı 3.5 GHz artışına sahiptir. Diğer birkaç SKU’da taban/yükseltme hızında 100 ila 200 MHz’lik bir düşüş görüyoruz, ancak bu düşüşler bazılarının korktuğu kadar belirgin değil.
Saat hızı ayarlamaları, temel frekansta 500 MHz’e varan düşüş ve hızlandırma saatlerinde 400 MHz’lik bir azalma ile frekans optimize edilmiş F serisi parçalarla karşılaştırmak için uzaklaştırdığımızda daha belirgindir. Ancak, bu tür ayarlamalar modele göre değişir. AMD’nin buradaki amacı, daha büyük L3 önbellekleri aracılığıyla daha yüksek performans sağlamak, böylece frekans ayarlamalarını dengelemek ve fayda sağlayan iş yükleri için daha fazla genel performans sunmaktır. AMD ayrıca mevcut EPYC sistemleriyle uyumluluğu sağlamak için işlemcileri mevcut yongalarla aynı TDP zarfı içinde tutmak istedi.
AMD ayrıca 3D V-Cache teknolojisi hakkında daha fazla ayrıntı paylaştı. Hızlı bir tazeleme olarak, 3D V-Cache, Ryzen bilgi işlem yongasının üzerinde dikey olarak ek 64 MB 7 nm SRAM önbelleği birleştirmek için hibrit bağlama kullanan yeni bir yeni teknik kullanır ve böylece kalıp başına L3 önbellek miktarını üç katına çıkarır. Derin dalış detaylarını buradan ve buradan okuyabilirsiniz.
AMD’nin 3B yığınlı SRAM kullanma motivasyonunu etkileyen birkaç faktör var, ancak bunlar arasında kilit nokta, SRAM yoğunluğunun mantık yoğunluğu kadar hızlı ölçeklenmemesidir. Sonuç olarak, önbellekler artık eskisinden daha yüksek bir kalıp alanı yüzdesi tüketiyor, ancak anlamlı kapasite artışları sağlamadan. Ayrıca, önbelleğin yanal olarak genişletilmesi, kablo uzunluğu nedeniyle daha yüksek gecikmeye neden olur ve AMD’nin çekirdekler için kullanabileceği mevcut kalıp alanını tüketir. Ek olarak, gecikme ve bant genişliği etkisi nedeniyle 2B düzende başka bir SRAM yongası eklemek mümkün değildir.
Bu sorunları çözmek için AMD, ek SRAM’ı doğrudan hesaplama kalıbının merkezinin üzerine yığarak, alt kalıbın güç sağlamasına ve L3 önbellek yongasının altından TSV bağlantıları aracılığıyla iletişim kurmasına olanak tanır. Bu bağlantılar dikey olarak üst kalıba girer ve dışarı çıkar, böylece standart bir düzlemsel (2D) önbellek genişletmesine kıyasla aslında verinin kat etmesi gereken mesafe miktarını ve dolayısıyla geçiş için gereken döngü sayısını azaltır. Sonuç olarak, L3 yongası, kalıp üstü L3 önbellek ile aynı 2 TB/sn’lik en yüksek verimi sağlar, ancak yalnızca dört döngü gecikme cezası ile birlikte gelir.
L3 önbellek yongası, alttaki CCD’deki L3 önbellek ile aynı miktarda alanı kaplar, ancak iki katı kapasiteye sahiptir. Bunun nedeni kısmen, ek L3 önbellek diliminin biraz ‘aptal’ olmasıdır – tüm kontrol devresi, gecikme ek yükünü azaltmaya yardımcı olan temel CCD’de bulunur. AMD ayrıca SRAM için özel olarak yoğunluğu optimize edilmiş 7nm sürümünü kullanır ve ayrıca taban kalıbından (13 metal katman) daha incedir.
L3 yongasındaki kontrol devresinin olmaması da kapasiteyi en üst düzeye çıkarır ve AMD’nin yalnızca önbelleğin erişilmekte olan kısımlarını seçici olarak ‘aydınlatmasına’ izin verir, böylece L3 önbellek kapasitesini üç katına çıkarmanın güç yükünü azaltır (ve hatta ortadan kaldırır). Ek olarak, daha büyük önbellek, daha yüksek L3 önbellek isabet oranları nedeniyle ana belleğe yapılan gezileri azalttığından, ek kapasite, ana bellek üzerindeki bant genişliği baskısını hafifletir, böylece gecikmeyi azaltır ve böylece birden çok eksenden uygulama performansını iyileştirir. Ana belleğe daha az yolculuk, genel güç tüketimini de azaltır.
L3 önbellek yongası, milimetre kare başına CPU çekirdeklerinden önemli ölçüde daha az güç tüketir. Yine de dikey istifleme güç yoğunluğunu arttırır, bu nedenle onu yonganın yanlarındaki ısı üreten çekirdeklerden izole etmek en iyisidir. Bununla birlikte, bu, CCD’nin üzerinde çıkıntılı bir kalıp bırakacaktır, bu nedenle AMD, yonganın üzerine oturan ısı yayıcı için eşit bir yüzey oluşturmak üzere L3 yongacığının üç tarafını saran tek bir silikon şim kullanır. Silikon mükemmel bir termal iletkendir, bu nedenle şim, ısının çekirdeklerden ısı dağıtıcıya aktarılmasına izin verir.
Tasarımın önceki işlemeleri, iki farklı silikon şimi ve kalıbın bir tarafından diğerine uzanan L3 önbellek kalıbını gösteriyor gibi görünüyordu. Bununla birlikte, AMD’nin Milan-X lansmanı için malzemeleri, hesaplama kalıbını kaplayan uzun bir altlık ve kalıbın kenarında L3 önbellek yongası tarafından kapsanmayan ince bir kısım açıkça görülüyor. Alt kalıbın bu ince genişliği, chipletin G/Ç kalıbı ile iletişim kurmak için kullandığı G/Ç işlevlerini içerir.
AMD, sertifikalı yazılım paketleri oluşturmak için birkaç ortakla birlikte çalışmasına rağmen, artan önbellek kapasitesinden yararlanmak için hiçbir yazılım değişikliğine gerek olmadığını söylüyor. Bu paketler daha fazla performans optimizasyonu da görebilir.
16 ve 24 çekirdekli Milan-X modelleri, hafif dişli olma eğiliminde olan elektronik tasarım otomasyonu (EDA) yazılımı için özellikle çok uygundur. Bununla birlikte, bu pahalı yazılım aynı zamanda çekirdek bazında lisanslanma eğilimindedir, bu nedenle iki potansiyel modele sahip olmak, müşterilerin optimum yapılandırmalarını seçmelerine olanak tanır. Bu arada, 24, 32 ve 64 çekirdekli modeller, hesaplamalı akışkanlar dinamiği (CFD), sonlu eleman analizi (FEA) ve yapısal analiz gibi daha zorlu dişli görevler için çok uygundur. Yine, mevcut çekirdek sayıları aralığı, lisanslama modellerine dayalı yapılandırmaya izin verir.
AMD, kendi dahili olarak türetilmiş karşılaştırmalı değerlendirmelerini sağladı, ancak satıcı tarafından sağlanan tüm test verilerinde olduğu gibi, buna dikkatle yaklaşmalısınız. Test notlarını yukarıdaki albümün sonuna ekledik.
AMD’nin kıyaslamaları, standart bir Milan modeline karşı 16 çekirdekli Milan-X için %66’lık bir kazanç içeriyor, ancak sonuçlar Intel’in Xeon’una karşı da aynı derecede etkileyici.
Amiral gemisi yongalarla yüksek iş parçacıklı iş yüklerine yönelen AMD, amiral gemisi 64 çekirdekli 7773X yongalarına sahip çift soketli bir sunucunun, iki soketli bir Intel Xeon 8380 sistemine (40 çekirdekli yonga) göre %44 ila %96 daha fazla performans sağladığını iddia ediyor. yapısal analiz, akışkanlar dinamiği ve FEA iş yüklerinin seçimi.
128 çekirdekli EPYC sunucusunun 80 çekirdekli Intel sunucusunu geçmesini beklersiniz, dolayısıyla AMD aynı uygulamalarla çekirdekten çekirdeğe bir karşılaştırma da sağladı. Burada AMD’nin 32-çekirdekli 7573X’inin Intel’in 32-çekirdekli Xeon 8382’si ile aynı ölçütlerde onu %23 ila %88 oranında geride bıraktığını görüyoruz.
AMD, 3D V-Cache mimarisiyle en iyi şekilde çalışan uygulama türlerinin gamını çalıştıran etkileyici bir ISV ortakları listesine sahiptir ve ayrıca Supermicro, Dell, Lenovo, HPE, Gigabyte ve QCT gibi donanım satıcılarından çok sayıda desteğe sahiptir. diğerleri arasında.
Milan-X işlemciler bugün dünya çapında perakendecilerden temin edilebilir ve sistemler OEM’lerde de mevcuttur. Ek olarak, Milan-X, Microsoft Azure’un HBv3 VM’leri aracılığıyla kullanılabilir.
Oyuncular, önümüzdeki ay 3D V-Cache teknolojisine sahip ilk oyun çipi olan Ryzen 7 5800X3D’ye sahip olacaklar.