Dünyanın en büyük çipinin üreticisi Cerebras Systems, CS-2 sisteminin artık araştırmacıların milyarlarca parametreli modelleri hızlı ve kolay bir şekilde eğitmesini mümkün kılacak PyTorch ve TensorFlow’u desteklediğini duyurdu.
Şirketin CS-2’si dünyanın en hızlı AI sistemidir ve Wafer-Scale Engine 2 (WSE-2) CPU’su tarafından desteklenmektedir. Cerebras Yazılım Platformunun (CSoft) 1.2 sürümünün piyasaya sürülmesiyle, CS-2 artık geliştiricilere çalıştırmak istedikleri model türleri söz konusu olduğunda daha fazla seçenek sunacak ek makine öğrenimi çerçevelerini destekliyor.
Cerebras Systems’da yapay zeka çerçevesinin kıdemli direktörü Emad Barsoum, bir basın bülteni CSoft’un artık geliştiricilerin TensorFlow veya PyTorch ile yazılmış modelleri nasıl ifade etmelerine olanak tanıdığına dair şunları söylüyor:
“Başından beri amacımız, müşterilerimizin yazmak istediği makine öğrenimi çerçevesini sorunsuz bir şekilde desteklemekti. Müşterilerimiz TensorFlow ve PyTorch’ta yazıyor ve yazılım yığınımız CSoft, modellerinizi çerçeve içinde ifade etmeyi hızlı ve kolay hale getiriyor. senin seçimin. Bunu yaparak müşterilerimiz, Cerebras CS-2’deki 850.000 AI için optimize edilmiş çekirdeğe ve 40 Gigabayt çip üzerinde belleğe erişim elde ediyor.”
Büyük dil modellerini ölçekleme
CSoft sürüm 1.2 artık geliştiricilerin modellerini PyTorch veya TensorFlow’un açık kaynak çerçevelerinde yazmalarına ve herhangi bir değişiklik yapmadan Cerebras CS-2’de çalıştırmalarına olanak tanıyor. Aynı zamanda, bir GPU veya CPU için yazılmış bir AI modeli, CS-2 üzerinde CSoft’ta herhangi bir değişiklik yapılmadan çalışabilir.
CS-2 ve CSoft’un birleşik gücüyle geliştiriciler, BERT gibi küçük modellerden GPT-3 gibi var olan en büyük modellere sorunsuz bir şekilde ölçeklenebilir.
Bir GPU kullanarak büyük modelleri eğitmek zorlu ve zaman alıcıdır; yeni veri kümeleri üzerinde sıfırdan eğitim vermek genellikle haftalar ve eski ekipman kümelerinde 10’larca megavat güç gerektirir. Ek olarak, kümenin boyutu büyüdükçe güç, maliyet ve karmaşıklık katlanarak büyür.
Cerebras Systems, CS-2’yi bu zorlukların üstesinden gelmek için inşa etti ve AI sistemi en büyük modelleri bile sadece birkaç dakika içinde kurabilir. Geliştiriciler CS-2 ile modellerini kurmak, yapılandırmak ve eğitmek için daha az zaman harcadıklarından, daha da kısa sürede daha fazla fikir keşfedebilirler.