Elon Musk ve xAI’nin arkasındaki ekip, 19 gün içinde 100.000 H200 Blackwell GPU’dan oluşan bir süper küme oluşturarak bir mühendislik harikasına imza attı. Nvidia CEO’su Jensen Huang, Elon Musk’un inanılmaz kurulum becerisinin hikayesini üyelere anlattı. Tesla Sahipleri X’teki Silikon Vadisi.
Huang, Musk’ın 19 günlük kaçışını huşu ve saygıyla anlatıyor ve bu çabayı “insanüstü” olarak nitelendiriyor. xAI ekibinin üç haftadan kısa bir sürede “konsept” aşamasından Nvidia’nın “donanımı” ile tam uyumluluğa geçtiği iddia ediliyor. Buna xAI’nin yeni inşa edilen üst kümede ilk yapay zeka eğitim çalışmasının yürütülmesi de dahildir.
Elon Musk süper insandır. Herkesin bir yılını alacak olan şey onun sadece 19 gününü aldı. pic.twitter.com/q51sM48lsu13 Ekim 2024
Başlangıçtan bitişe kadar süreç, GPU’ların bulunacağı devasa X fabrikasının inşasını ve 200.000 GPU’nun tamamını çalışır hale getirmek için tüm fabrikanın sıvı soğutma ve güçle donatılmasını içeriyordu. Bu, tüm donanım ve altyapının hassas ve koordineli bir şekilde sevk edilmesi ve kurulması için Nvidia’nın ve Elon Musk’un mühendislik ekipleri arasındaki koordinasyondan bahsetmiyorum bile.
Perspektif açısından Huang, Elon Musk ve ekibinin 19 günde yapabildiklerini yapmanın ortalama bir veri merkezinin dört yıl sürdüğünü belirtiyor. Bu sürenin yalnızca üç yılı planlamaya ayrılacak, son yılı ise ekipmanın nakliyesi, kurulumu ve her şeyin çalışır hale getirilmesi için kullanılacaktı.
Huang ayrıca Nvidia’nın donanımındaki ağ bağlantısının ne kadar karmaşık olduğunu açıklayarak ayrıntılara giriyor. Nvidia’nın donanımını ağ oluşturmanın, geleneksel veri merkezi sunucularını ağ oluşturmaya benzemediğini açıklıyor. “Bir düğüme giden kabloların sayısı… bir bilgisayarın arka tarafının tamamı kablolardır.”
Elon Musk’un 100.000 H200 GPU entegrasyonu “daha önce hiç yapılmamıştı” (Jensen Huang’a göre) ve muhtemelen başka bir şirket tarafından en azından çok uzun bir süre boyunca kopyalanmayacak.