Google, Google I/O’yu başlattı bu öğleden sonra yapay zekadaki sayısız ilerlemesi hakkında bir saatten fazla konuşarak. Şirket, üretken yapay zeka için Bard sohbet robotu aracına güç veren yeni PaLM 2 büyük dil modelini (LLM) tartıştı. Bu, Google Haritalar, Google Fotoğraflar ve Gmail (diğerlerinin yanı sıra) dahil olmak üzere Google’ın ürün portföyüne yapay zeka ile aşılanmış özellikler eklemek için temel bir dayanaktır.
Bunu göz önünde bulundurarak, milyonlarca (ve sonunda milyarlarca) kullanıcı, bir resmin arka planında kalan bir kişiyi kaldırmak kadar sıradan işlemler için istekler gönderdiğinden, vahşi ortamda modellere güç sağlamak için bulutta ciddi bir beygir gücüne ihtiyaç vardır. kısa bir metin istemine dayalı olarak sizin için tam bir e-posta oluşturmak. Google’ın yeni A3 GPU süper bilgisayarının odaklandığı yer burasıdır. Google, yeni A3 süper bilgisayarların “günümüzün üretken yapay zekasına ve büyük dil modeli yeniliğine güç veren en zorlu yapay zeka modellerini eğitmek ve bunlara hizmet etmek için özel olarak üretildiğini” ve aynı zamanda 26 exaFlop yapay zeka performansı sunduğunu söylüyor.
Her A3 süper bilgisayarı, 2 TB DDR5-4800 bellekle desteklenen 4. nesil Ölçeklenebilir Intel Xeon işlemcilerle donatılmıştır. Ancak operasyonun gerçek “beyinleri”, NVLink 4.0 ve NVSwitch’ten yararlanarak 3,6 TB/sn iki bölümlü bant genişliğine erişimi olan sekiz Nvidia H100 “Hopper” GPU’dan geliyor.
Google’a göre A3, ana CPU’yu atlayarak 200 Gb/sn’de veri paylaşımına izin veren GPU’dan GPU’ya veri arayüzünün ilk üretim düzeyinde dağıtımını temsil ediyor. Google’ın Altyapı İşleme Birimi (IPU) olarak adlandırdığı bu arayüz, A2 sanal makinelere kıyasla A3 sanal makineler (VM) için kullanılabilir ağ bant genişliğinde 10 kat artış sağlar.
NVIDIA’da hiper ölçek ve yüksek performanslı bilgi işlemden sorumlu Başkan Yardımcısı Ian Buck, “Google Cloud’un yeni nesil NVIDIA H100 GPU’ları tarafından desteklenen A3 VM’leri, üretken yapay zeka uygulamalarının eğitimini ve sunumunu hızlandıracak” dedi. “Google Cloud’un kısa süre önce piyasaya sürdüğü G2 bulut sunucularının hemen ardından, amaca yönelik oluşturulmuş yapay zeka altyapısıyla dünyanın dört bir yanındaki işletmelerin dönüştürülmesine yardımcı olmak için Google Cloud ile çalışmaya devam etmekten gurur duyuyoruz.”
İşletmeniz A3 sanal makinelerinden yararlanmak istiyorsa, erişim elde etmenin tek yolu Google’ın A3 Önizleme İlgi Formu Erken Erişim Programına katılmak için. Ancak Google’ın açıkça belirttiği gibi, bilgilerinizi girmeniz programda bir yer garanti etmez.