AMD CEO’su Lisa Su, prestijli ödülü kabul etmek için imec’in ITF World 2024 konferansına katıldı imec İnovasyon Ödülü yenilik ve endüstri liderliği için Gordon Moore, Morris Chang ve Bill Gates gibi daha önce ödül alan diğer kişilerin saflarına katılmak. Ödülü aldıktan sonra Su, AMD’nin şirketin 2025 yılına kadar bilgi işlem düğümü güç verimliliğinde 30 kat artış hedefleyen 30×25 hedefine ulaşmak için attığı adımları kapsayan sunumuna başladı. Su, AMD’nin bu hedefe ulaşma yolunda sadece ilerlemediğini duyurdu. hedef, ancak aynı zamanda 2026’dan 2027’ye kadar 100 kattan fazla iyileşmeye giden bir yol da görüyor.
Yapay zeka güç kullanımına ilişkin artan endişeler, ChatGPT gibi üretken yapay zeka yüksek öğrenimlerinin ana akımda patlaması nedeniyle artık ilgi odağı haline gelmişken, AMD, yapay zekanın doymak bilmez güç iştahıyla ilgili sorunları 2021 yılına kadar öngörme vizyonuna sahipti. AMD 30×25 hedefi üzerinde çalışmaya başladı Veri merkezi bilgi işlem düğümü güç verimliliğini artırmak, özellikle yapay zeka ve HPC güç tüketiminin yaklaşmakta olan bir sorun olduğunu belirtmek. (AMD, ilk iddialı enerji hedefini 2014 yılında, tüketici işlemci güç verimliliğini 2020 yılına kadar 25 kat artırma yönündeki ilk 25×20 hedefiyle belirledi ve bu rakamı 31,7 kat artırmayla aştı.)
Bu sorun artık ön plana çıktı. Dünyanın en büyük şirketleri yapay zeka üstünlüğü için yarışırken, üretken yapay zeka, veri merkezlerinin hızla genişlemesini körüklüyor, ancak kamu elektrik şebekeleri, güce aç veri merkezlerinin ani yükselişine hazırlıklı değil, bu da gücü yeni sınırlayıcı faktör haline getiriyor. Şebeke kapasitesi, altyapı ve çevresel kaygılar hem yeni hem de genişleyen veri merkezlerine tahsis edilebilecek kapasiteyi sınırladığından, veri merkezlerinin kullanabileceği güç miktarı üzerinde katı sınırlar bulunmaktadır. Aslında, enerji tedarikini sağlamak için enerji santrallerinin yanında birçok yeni veri merkezi inşa ediliyor ve hatta ezici talep, nükleer Küçük Modül Reaktörlerin (SMR’ler) bireysel veri merkezlerini beslemesine yönelik baskıyı yeniden alevlendirdi.
Modelleri eğitmek için gereken bilgi işlem miktarı arttıkça sorun daha da yoğunlaşıyor. Su, ilk görüntü ve konuşma tanıma yapay zeka modellerinin boyutunun her iki yılda bir iki katına çıktığını ve bu durumun son on yılda bilgi işlem gücündeki ilerlemelerle büyük oranda eşleştiğini belirtti. Ancak üretken yapay zeka modellerinin boyutu artık yılda 20 kat artarak bilgi işlem ve bellekteki ilerlemelerin hızını geride bırakıyor. Su, günümüzün en büyük modellerinin onbinlerce megawatt saate kadar enerji tüketen onbinlerce GPU ile eğitildiğini, hızla genişleyen model boyutlarının yakında eğitim için yüzbinlerce GPU’ya, belki de birkaç gigawatt’lık güce ihtiyaç duyabileceğini söyledi. tek bir modeli eğitin. Bu kesinlikle savunulabilir bir durum değil.
AMD’nin güç verimliliğini artırmaya yönelik, silikon mimarileri ve gelişmiş paketleme stratejilerinin ötesinde yapay zekaya özgü mimarilere, sistem ve veri merkezi düzeyinde ayarlamalara ve yazılım ve donanım ortak tasarım girişimlerine uzanan geniş bir yaklaşımdan oluşan çok yönlü bir stratejisi var. .
Doğal olarak silikon ana kayadır. Su, AMD’nin güç verimliliğini ve performansını artırmaya yönelik silikon yol haritasındaki bir sonraki adımı olarak 3nm Gate Allaround (GAA) transistörlerin yanı sıra daha fazla güç verimliliği ve uygun maliyetli modüler tasarımlar sağlayan gelişmiş paketleme ve ara bağlantılara odaklanmaya devam ettiğini belirtti. Gelişmiş paketleme, tek bir çip paketinin kısıtlamaları dahilinde daha fazla beygir gücü üretmek için tasarımların ölçeklendirilmesinde önemli bir rol oynuyor ve AMD, her kareden elde edebileceği watt başına bilgi işlem miktarını en üst düzeye çıkarmak için 2,5D ve 3D paketlemenin bir karışımını kullanıyor milimetrelik veri merkezi silikonu.
Sunucu düğümleri ve sunucu rafları arasında veri aktarımı, daha uzun mesafeler nedeniyle ekstra güç tüketir; dolayısıyla veri konumu için optimizasyon, muazzam güç tasarrufu sağlayabilir. AMD’nin MI300X’i, her zamankinden daha büyük çip paketleri oluşturmanın getirdiği verimliliğin harika bir örneğidir; çip, 192 GB bellek kapasitesi sağlayan 24 HBM3 çip ile eşleştirilmiş 12 çiplete yayılmış 153 milyar transistöre sahiptir ve bunların tümü GPU’da yerel olarak mevcuttur hafıza. Paket içi birimler arasındaki güç ve performans açısından optimize edilmiş sonsuz Yapı ara bağlantılarıyla eşleştirilen olağanüstü bilgi işlem ve bellek yoğunluğu, daha fazla veriyi işlem çekirdeklerine yakın tutar ve böylece veri aktarımı için gereken enerji miktarını azaltır.
Su, donanım optimizasyonlarının önemli olduğunu ancak AMD’nin donanım ve yazılım ortak optimizasyonu konusundaki çalışmalarının da etkileyici sonuçlar verdiğini söyledi. Daha düşük hassasiyetli sayısal formatların kullanılması, güç verimliliğini ve performansı artırır; bu nedenle, belirli donanım hızlandırmasında tasarım yapmak, sürekli ölçeklendirme için önemlidir. Yukarıdaki slaytlarda görebileceğiniz gibi, FP4 gibi daha düşük hassasiyetli formatlara geçiş, tüketilen enerjinin Joule başına FLOP’larını büyük ölçüde artırır; FP32 ile karşılaştırıldığında, FP8 güç verimliliğinde 15 kat artış sağlarken FP4 yaklaşık 30 kat iyileşme sağlar.
Daha düşük hassasiyet, daha düşük doğrulukla sonuçlanır, ancak Su, gelişmiş kuantizasyon tekniklerinin bu sorunun çözülmesine yardımcı olduğunu vurguladı. Aslına bakılırsa, MXFP6 bile FP32’ye benzer doğruluk üretebilir; bu düşüş yalnızca MXFP4’te birkaç farklı modelde görülürken, diğerleri hala aynı derecede doğrudur. Düşük hassasiyetli formatların doğruluğunu iyileştirmeye yönelik çalışmalar devam ediyor; hatta gelecekte daha birçok modelde MXFP4’ün FP32 kadar hassas hale geldiğini bile görebiliriz.
Genel olarak Su, AMD’nin düğüm başına güç verimliliği konusunda sektörün ilerleme hızını aştığını ve şirketin 30 kat güç verimliliği artışını yakalamaya devam ettiğini söyledi. Su, bu trendin devam etmesini bekliyor ve şunları söylüyor: “Bugün gördüklerimize dayanarak, bu tür inovasyonlarla bundan daha iyisini yapabileceğimizi düşünüyoruz. 2026 ve 2027’ye geldiğimizde 100’den fazla kat daha fazlasını yapma yolunda ilerliyoruz. Ve bu alanda yapabileceğimiz çok çok daha fazlası var.”
Imec’in etkinliğinde diğerlerinin yanı sıra ASML, TSMC, Intel ve SK hynix gibi çok sayıda yarı iletken şirketinden güçlü bir sunucu kadrosu vardı ve konuşmacıların çoğu Su’nun veri merkezi güç tüketiminin ve bununla ilişkili çevresel sonuçların giderek daha da kötüleştiği yönündeki düşüncelerini yineledi. birinci dereceden bir sorun.
Su, güç verimliliği iyileştirmelerinin hızını sürdürmenin sektör çapında çaba gerektireceğini belirtti. “Birçok farklı yeteneği ve birçok farklı uzmanlığı bir araya getirerek bu ekosistemi yönlendirme fırsatına sahibiz. Bence yeni nesil inovasyonun anahtarı bu” dedi Su.
“Hepimiz belirli alanlarda uzmanız, ancak süreç çalışanlarını, paketleme çalışanlarını, donanım tasarımcılarını, mimarları, yazılım modellerini ve sistem tasarımcılarını bir araya getirdiğimizde, ileriye dönük inovasyon eğrisini gerçekten büken bütünsel tasarım yeteneğini elde edebiliriz.” dedi Su.
İşleyicilerin üretilmesi aynı zamanda karbon ve su açısından yoğun bir süreç olduğundan sürdürülebilirlik etkinliğin ana konusuydu. Su, şirketin karbon ayak izini azaltma konusunda kaydettiği ilerlemeye değinmedi ancak şirket yakın zamanda bu alandaki başarılarını bir blog yazısında özetledi, chiplet tabanlı mimarilerden yararlanmanın, sonuçta fabrikasyon için ihtiyaç duyduğu levha sayısını azaltan verim iyileştirmeleri sayesinde 2023’te ~50 bin metrik ton CO2e tasarrufu sağladığını söylüyor. Bu tek yılın C02e tasarrufu, AMD’nin 2022 yılının tamamındaki operasyonel ayak izinin tamamına eşdeğerdi; bu da AMD’nin çevresel zorluklarla birçok açıdan mücadele ettiğinin altını çiziyor.