AMD Instinct MI300X ve MI300A, yapay zeka segmentinde önümüzdeki ay piyasaya sürülecek en çok beklenen hızlandırıcılardan bazıları. AMD’nin ilk tam teşekküllü yapay zeka başyapıtı hakkında pek çok beklenti var ve bugün size bu teknik harikadan neler bekleyebileceğimize dair bir özet sunmayı düşündük.
AMD Instinct MI300X, GPU Hızlandırmalı Yapay Zeka İş Yükleri için Tasarlanırken MI300A, Teknik Açıdan En Gelişmiş APU Paketiyle HPC ile Mücadele Ediyor
6 Aralık’ta AMD, ana gündemlerinden birinin MI300 kod adlı yeni nesil Instinct hızlandırıcı ailesinin tam olarak tanıtılması olduğu “Gelişen Yapay Zeka” açılış konuşmasına ev sahipliği yapacak. Bu yeni GPU ve CPU hızlandırmalı aile, AMD’nin 1 numaralı ve şu anda en önemli stratejik önceliği olan yapay zeka segmentinin lider ürünü olacak ve sonunda sadece gelişmiş değil aynı zamanda gereksinimleri karşılayacak şekilde tasarlanmış bir ürünü piyasaya sürecek. Sektördeki kritik yapay zeka gereksinimi. MI300 sınıfı AI hızlandırıcılar, TSMC’nin gelişmiş paketleme teknolojilerinden yararlanan başka bir chiplet güç merkezi olacak, bu yüzden bu AI canavarlarının altında ne olduğunu görelim.
AMD Instinct MI300X – CDNA 3 ve Devasa Bellekle NVIDIA’nın Yapay Zeka Üstünlüğüne meydan okuyor
AMD Instinct MI300X, AI segmentindeki NVIDIA’nın Hopper ve Intel’in Gaudi hızlandırıcılarını açıkça hedef aldığından kesinlikle en çok öne çıkacak çiptir. Bu çip yalnızca CDNA 3 mimarisine göre tasarlandı ve pek çok şey yapılıyor. Çip, tümü 153 Milyar transistöre (MI300X) kadar sunmak üzere bir araya getirilen 5nm ve 6nm IP’lerin bir karışımını barındıracak.
Tasarımdan başlayarak ana aracı, yeni nesil Infinity Fabric çözümü kullanılarak ara bağlantı katmanını barındıran pasif bir kalıpla yerleştirildi. Aracı, sekiz HBM3 paketi, HBM paketleri arasında 16 yapay kalıp ve dört aktif kalıp içeren toplam 28 kalıp içerir ve bu aktif kalıpların her biri iki hesaplama kalıbı alır.
CDNA 3 GPU mimarisini temel alan her bir GCD, 2560 çekirdeğe karşılık gelen toplam 40 işlem birimine sahiptir. Toplamda sekiz hesaplama kalıbı (GCD) vardır, bu da bize toplam 320 Bilgi İşlem ve 20.480 çekirdek birim sağlar. Verim açısından AMD bu çekirdeklerin küçük bir kısmını küçültecek ve bundan bir ay sonra kesin yapılandırmalar hakkında daha fazla ayrıntı alacağız.
Bellek, MI300X’in selefi MI250X’e (128 GB) göre %50 daha fazla HBM3 kapasitesine sahip olmasıyla büyük bir yükseltme göreceğiniz başka bir alandır. AMD, 192 GB’lık bir bellek havuzu elde etmek için MI300X’i 8 HBM3 yığınıyla donatıyor ve her yığın 12-Hi olup, bize IC başına 2 GB veya yığın başına 24 GB kapasite sağlayan 16 Gb IC’leri dahil ediyor.
Bellek, 5,2 TB/s’ye kadar bant genişliği ve 896 GB/sn Infinity Fabric Bant Genişliği sunacak. Karşılaştırma yapmak gerekirse, NVIDIA’nın yakında çıkacak olan H200 AI hızlandırıcısı 141 GB kapasite sunarken Intel’in Gaudi 3’ü 144 GB kapasite sunacak. Büyük bellek havuzları, çoğunlukla belleğe bağlı olan Yüksek Lisans’larda çok önemlidir ve AMD, bellek departmanında lider olarak AI yeteneğini kesinlikle gösterebilir. Karşılaştırmalar için:
- İçgüdü MI300X – 192 GB HBM3
- Gaudi 3 – 144GB HBM3
- H200 – 141 GB HBM3e
- MI300A – 128GB HBM3
- MI250X – 128 GB HBM2e
- H100 – 96 GB HBM3
- Gaudi 2 – 96 GB HBM2e
Güç tüketimi açısından AMD Instinct MI300X, 750W olarak derecelendirilmiştir; bu, Instinct MI250X’in 500W’ına göre %50 ve NVIDIA H200’e göre 50W daha fazladır.
AMD Instinct MI300A – Yoğun Paketlenmiş Exascale APU’lar Artık Gerçek
Yıllardır AMD’nin sonunda Exascale sınıfı APU vaadini yerine getirmesini bekledik ve Instinct MI300A’nın piyasaya sürülmesine yaklaştığımız gün yaklaşıyor. MI300A’nın ambalajı, TCO için optimize edilmiş bellek kapasitelerini ve Zen 4 çekirdeklerini kullanması dışında MI300X’e çok benzer.
Aktif kalıplardan birinde iki adet CDNA 3 GCD kesilip yerine kendi ayrı önbellek ve çekirdek IP havuzları sunan üç Zen 4 CCD yerleştirildi. CCD başına 8 çekirdek ve 16 iş parçacığı elde edersiniz, yani aktif kalıpta toplam 24 çekirdek ve 48 iş parçacığı bulunur. Ayrıca 24 MB L2 önbellek (çekirdek başına 1 MB) ve ayrı bir önbellek havuzu (CCD başına 32 MB) bulunmaktadır. CDNA 3 GCD’lerin ayrıca L2 önbelleğinin ayrı olduğu unutulmamalıdır.
AMD Instinct MI300 Hızlandırıcıların öne çıkan bazı özelliklerini özetlersek:
- İlk Entegre CPU+GPU Paketi
- Exascale Süper Bilgisayar Pazarını Hedeflemek
- AMD MI300A (Entegre CPU + GPU)
- AMD MI300X (Yalnızca GPU)
- 153 Milyar Transistör
- 24’e kadar Zen 4 Çekirdeği
- CDNA 3 GPU Mimarisi
- 192 GB’a kadar HBM3 Bellek
- 8 Chiplet’e kadar + 8 Bellek Yığını (5nm + 6nm işlem)
Tüm bunları bir araya getiren AMD, ekosistem sağlayıcıları ve ortaklarıyla birlikte çalışarak MI300 AI hızlandırıcılarını, asma konnektörlerle ana karta bağlanan SXM tasarımlarına sahip 8 yollu konfigürasyonlarda sunacak. Bunların ne tür konfigürasyonlar içinde sunulacağını görmek ilginç olacak ve SXM kartları verilmiş olsa da, PCI-E form faktörlerinde de birkaç değişken bekleyebiliriz.
Şimdilik AMD, NVIDIA’nın 2024 Blackwell GPU’ları için bazı büyük rakamları açıkladığı ve Intel’in Guadi 3 ve Falcon Shores GPU’larını önümüzdeki yıllarda piyasaya sürülmeye hazırladığını, rakiplerinin de yapay zeka çılgınlığında tam gaz ilerlediğini bilmeli. fazla. Şu anda kesin olan bir şey var ki, AI müşterileri alabilecekleri neredeyse her şeyi silip süpürecek ve herkes bundan yararlanacak. Ancak AMD’nin, yalnızca NVIDIA’ya alternatif olmayı değil, aynı zamanda yapay zeka segmentinde lider olmayı hedefleyen çok güçlü bir çözümü var ve MI300’ün bu başarıya ulaşmalarına yardımcı olabileceğini umuyoruz.
AMD Radeon Instinct Hızlandırıcıları
Hızlandırıcı Adı | AMD Instinct MI400 | AMD Instinct MI300 | AMD Instinct MI250X | AMD İçgüdü MI250 | AMD İçgüdü MI210 | AMD İçgüdü MI100 | AMD Radeon Instinct MI60 | AMD Radeon Instinct MI50 | AMD Radeon Instinct MI25 | AMD Radeon Instinct MI8 | AMD Radeon Instinct MI6 |
---|---|---|---|---|---|---|---|---|---|---|---|
CPU Mimarisi | Zen 5 (Exascale APU) | Zen 4 (Exascale APU) | Yok | Yok | Yok | Yok | Yok | Yok | Yok | Yok | Yok |
GPU Mimarisi | CDNA 4 | Su Vanjaramı (CDNA 3) | Aldebaran (CDNA 2) | Aldebaran (CDNA 2) | Aldebaran (CDNA 2) | Arkturus (CDNA 1) | Vega 20 | Vega 20 | Vega 10 | Fiji XT | Polaris10 |
GPU İşlem Düğümü | 4nm | 5nm+6nm | 6nm | 6nm | 6nm | 7 nm FinFET | 7 nm FinFET | 7 nm FinFET | 14 nm FinFET | 28nm | 14 nm FinFET |
GPU Yongaları | henüz bilinmiyor | 8 (MCM) | 2 (MCM) 1 (Kalıp Başına) |
2 (MCM) 1 (Kalıp Başına) |
2 (MCM) 1 (Kalıp Başına) |
1 (Monolitik) | 1 (Monolitik) | 1 (Monolitik) | 1 (Monolitik) | 1 (Monolitik) | 1 (Monolitik) |
GPU Çekirdekleri | henüz bilinmiyor | 19.456’ya kadar | 14.080 | 13.312 | 6656 | 7680 | 4096 | 3840 | 4096 | 4096 | 2304 |
GPU Saat Hızı | henüz bilinmiyor | TBA | 1700 MHz | 1700 MHz | 1700 MHz | 1500 MHz | 1800 MHz | 1725MHz | 1500 MHz | 1000 MHz | 1237 MHz |
FP16 Bilgisayar | henüz bilinmiyor | TBA | 383 ÜST | 362 ÜST | 181 ÜST | 185 TFLOP | 29,5 TFLOP | 26,5 TFLOP | 24.6 TFLOP | 8.2 TFLOP’lar | 5.7 TFLOP’lar |
FP32 Bilgisayar | henüz bilinmiyor | TBA | 95,7 TFLOP | 90,5 TFLOP | 45.3 TFLOP | 23.1 TFLOP’lar | 14.7 TFLOP’lar | 13.3 TFLOP’lar | 12.3 TFLOP’lar | 8.2 TFLOP’lar | 5.7 TFLOP’lar |
FP64 Bilgisayar | henüz bilinmiyor | TBA | 47,9 TFLOP | 45.3 TFLOP | 22.6 TFLOP | 11.5 TFLOP | 7.4 TFLOP’lar | 6.6 TFLOP | 768 GFLOP | 512 GFLOP | 384 GFLOP |
VRAM | henüz bilinmiyor | 192 GB HBM3 | 128 GB HBM2e | 128 GB HBM2e | 64 GB HBM2e | 32GB HBM2 | 32GB HBM2 | 16GB HBM2 | 16GB HBM2 | 4GB HBM1 | 16 GB GDDR5 |
Hafıza saati | henüz bilinmiyor | 5,2 Gb/sn | 3,2 Gb/sn | 3,2 Gb/sn | 3,2 Gb/sn | 1200 MHz | 1000 MHz | 1000 MHz | 945 MHz | 500 MHz | 1750 MHz |
Bellek Veriyolu | henüz bilinmiyor | 8192-bit | 8192-bit | 8192-bit | 4096 bit | 4096 bit veri yolu | 4096 bit veri yolu | 4096 bit veri yolu | 2048 bit veri yolu | 4096 bit veri yolu | 256 bit veri yolu |
Bellek Bant Genişliği | henüz bilinmiyor | 5,2 TB/sn | 3,2 TB/sn | 3,2 TB/sn | 1,6 TB/sn | 1,23 TB/sn | 1 TB/sn | 1 TB/sn | 484 GB/sn | 512 GB/sn | 224 GB/sn |
Form faktörü | henüz bilinmiyor | OAM | OAM | OAM | Çift Yuvalı Kart | Çift Yuvalı, Tam Uzunlukta | Çift Yuvalı, Tam Uzunlukta | Çift Yuvalı, Tam Uzunlukta | Çift Yuvalı, Tam Uzunlukta | Çift Yuvalı, Yarım Uzunlukta | Tek Yuvalı, Tam Uzunlukta |
Soğutma | henüz bilinmiyor | Pasif Soğutma | Pasif Soğutma | Pasif Soğutma | Pasif Soğutma | Pasif Soğutma | Pasif Soğutma | Pasif Soğutma | Pasif Soğutma | Pasif Soğutma | Pasif Soğutma |
TDP (Maks.) | henüz bilinmiyor | 750W | 560W | 500W | 300W | 300W | 300W | 300W | 300W | 175W | 150W |