Cerebras CS-2 Gofret Ölçekli Yonga, Her Bir GPU'yu Sıçrayışlar ve Sınırlarla Daha İyi Performans Gösterdi, Tek Bir Cihazda Eğitilen En Büyük Yapay Zeka Modelinin Rekorunu Kırdı - Dünyadan Güncel Teknoloji Haberleri

Cerebras, dünyanın en büyük hızlandırıcı çipi olan CS-2’nin geliştirilmesini ve üretimini geliştiren ve üreten tek bir cihazda en kapsamlı küresel Doğal Dil İşleme (NLP) AI modelinin en önemli öğrenme girişimi olan şirket için bir bağlantı noktası ilan etti. Gofret Ölçekli Motor.

Cerebras, tek bir çip üzerinde iş yüklerinde yirmi milyar parametreye erişiyor

Cerebras tarafından eğitilen yapay zeka modeli, benzersiz ve dikkat çekici yirmi milyar parametreye ulaştı. Cerebras, iş yükünü çok sayıda hızlandırıcı arasında ölçeklendirmek zorunda kalmadan bu eylemi tamamladı. Cerebras’ın zaferi, önceki modellere kıyasla yazılım gereksinimlerinin altyapısı ve karmaşıklığının azaltılmış olması nedeniyle makine öğrenimi için kritik öneme sahiptir.

Think Silicon, Embedded World 2022 konferansında ilk düşük güçlü RISC-V 3D GPU’yu sergiliyor

Wafer Scale Engine-2, piyasadaki yüzlerce premium çipe eşit olan 7 nm’lik ayrı bir gofrete işlenmiştir ve 2,6 trilyon 7 nm transistöre sahiptir. Wafer ve transistörlerin yanı sıra, Wafer Scale Engine-2, 15kW güç tüketimi ile 850.000 çekirdek ve 40 GB entegre önbellek içerir. Tom’s Hardware, “tek bir CS-2 sisteminin tek başına bir süper bilgisayara benzediğini” belirtiyor.

Bireysel bir çipte 20 milyar parametreli bir NLP modeli kullanan Cerebras’ın avantajı, şirketin binlerce GPU, donanım ve ölçeklendirme gereksinimlerinin eğitim maliyetinde ek yükünü azaltmasına olanak tanır. Buna karşılık şirket, çeşitli modelleri çip üzerinde bölümlere ayırmanın teknik zorluklarını ortadan kaldırabilir. Şirket, bunun “NLP iş yüklerinin en acı verici yönlerinden biri olduğunu, […] tamamlanması aylar alıyor.”

Bu, yalnızca işlenmiş her bir sinir ağı, GPU spesifikasyonları ve tüm bileşenleri birleştiren genel ağ için olağandışı olmayan ve araştırmacıların eğitimin ilk bölümünden önce ilgilenmesi gereken özel bir sorundur. Eğitim ayrıca tektir ve birden fazla sistemde kullanılamaz.

NLP’de daha büyük modellerin daha doğru olduğu gösterilmiştir. Ancak geleneksel olarak, yalnızca birkaç seçkin şirket, bu büyük modelleri parçalamak ve bunları yüzlerce veya binlerce grafik işleme birimine yaymak için gereken özenli işi yapmak için gerekli kaynaklara ve uzmanlığa sahipti. Sonuç olarak, çok az şirket büyük NLP modellerini eğitebilirdi – çok pahalıydı, zaman alıcıydı ve endüstrinin geri kalanı için erişilemezdi. Bugün, GPT-3XL 1.3B, GPT-J 6B, GPT-3 13B ve GPT-NeoX 20B’ye erişimi demokratikleştirmekten gurur duyuyoruz ve tüm AI ekosisteminin dakikalar içinde büyük modeller kurmasını ve bunları tek bir CS üzerinde eğitmesini sağlıyoruz. 2.

—Andrew Feldman, Cerebras Systems CEO’su ve Kurucu Ortağı

Şu anda, daha az parametre kullanmak zorunda kalarak son derece iyi performans gösteren sistemler gördük. Böyle bir sistem, sürekli olarak GPT-3’ü ve Gopher’ın 70 milyar parametresini aşan Chinchilla’dır. Bununla birlikte, Cerebras’ın başarısı, araştırmacıların, yeni Wafer Scale Engine-2 üzerinde diğerlerinin yapamayacağı şekilde, kademeli olarak ayrıntılı modeller hesaplayabileceklerini ve oluşturabileceklerini keşfedecekleri için son derece önemlidir.

EVGA, GPU Piyasası Normalleşirken GeForce RTX 30 Grafik Kartları İçin Kuyruk Sistemini Sonlandırıyor

Çok sayıda uygulanabilir parametrenin arkasındaki teknoloji, şirketin Ağırlık Akışı teknolojisini kullanır ve araştırmacıların “hesaplama ve bellek ayak izlerini ayırmasına olanak tanır ve belleğin, AI iş yüklerinde hızla artan sayıda parametreyi depolamak için gereken miktara göre ölçeklendirilmesine olanak tanır” ” Buna karşılık, öğrenmeyi ayarlamak için geçen süre, yalnızca birkaç standart komutla aylardan dakikalara düşürülecek ve GPT-J ve GPT-Neo arasında kusursuz geçiş yapılmasına olanak tanıyacaktır.

Cerebras’ın büyük dil modellerini uygun maliyetli, kolay erişimle kitlelere ulaştırma yeteneği, yapay zekada heyecan verici yeni bir çağın kapılarını açıyor. On milyonlarca harcayamayan kuruluşlara, ana lig NLP’sine kolay ve ucuz bir rampa sağlar. CS-2 müşterilerinin GPT-3 ve GPT-J sınıfı modelleri büyük veri kümeleri üzerinde eğitirken yaptıkları yeni uygulamaları ve keşifleri görmek ilginç olacak.

—Dan Olds, Baş Araştırma Görevlisi, Intersect360 Research

Haber kaynakları: TomDonanım,

genel-17

Cerebras CS-2 Gofret Ölçekli Yonga, Her Bir GPU’yu Sıçrayışlar ve Sınırlarla Daha İyi Performans Gösterdi, Tek Bir Cihazda Eğitilen En Büyük Yapay Zeka Modelinin Rekorunu Kırdı

Byteknomers

Cerebras, tek bir çip üzerinde iş yüklerinde yirmi milyar parametreye erişiyor

By teknomers

Benzer İçerikler

Final Fantasy XVI: Yükselen Dalga

En eşsiz ve heyecan verici Diablo 4 yarışmacısı artık Steam’de

Meta AI ile yapay zeka Facebook, Whatsapp ve Instagram’a geliyor ve kişisel asistanımız olacak

Larian Studios başka bir Baldur’s Gate devamı yapmak istemiyor, bu yüzden Hasbro başka yere bakıyor

Dragon Ball FighterZ Güncellemesi 1.000.003 Uçuyor

Bu yeni bilim kurgu uzay gemisi keşif simülasyonunda FTL, Noita’ya çarpıyor

Kingdom Come: Deliverance 2 Bu Yılın Sonunda Bohemya’ya Geri Dönüyor

AB’deki iPhone kullanıcıları ilk üçüncü taraf uygulama mağazası olan AltStore PAL’a sahip oluyor

Hayranların favorisi JBL Flip 5, 100 dolardan daha düşük bir fiyatla satışta ve ucuza dinleme keyfinizi artırmanın heyecanını yaşıyor

Yeni OLED iPad Pro M3’ten bahsedelim

Adı açıklanmayan dökümhane, ASML’nin 400 milyon dolarlık ikinci nesil EUV makinesinin ikinci alıcısı oldu

NASA ve Boeing, Tarihi ISS Yolculuğuna Starliner ve Atlas V Roket Hazırlığı Hazırlıyor

NASA’dan Juno, Io’daki dağ ve lav gölünün havadan görüntülerini veriyor

Araştırmacılar, ay yaşam alanları için ideal yerinde inşaat yöntemini belirliyor

Yıldız Manyetizması Uzak Dünyalara Bakışımızı Nasıl Yeniden Şekillendiriyor?

İlginizi Çekebilir

İlk kıyaslama Samsung Galaxy Z Flip 6’nın önemli özelliklerini ortaya koyuyor

Final Fantasy XVI: Yükselen Dalga

En eşsiz ve heyecan verici Diablo 4 yarışmacısı artık Steam’de

Meta AI ile yapay zeka Facebook, Whatsapp ve Instagram’a geliyor ve kişisel asistanımız olacak