Massachusetts merkezli bir yapay zeka (AI) girişimi olan Liquid AI, mevcut transformatör mimarisi üzerine inşa edilmeyen ilk üretken AI modellerini duyurdu. Sıvı Temel Modeli (LFM) olarak adlandırılan yeni mimari, OpenAI, Gemini, Copilot ve daha fazlasının GPT serisi gibi popüler yapay zeka modellerinin temeli olan Üretken Önceden Eğitimli Transformatörlerden (GPT’ler) uzaklaşıyor. Başlangıç, yeni yapay zeka modellerinin ilk ilkelerden yola çıkılarak oluşturulduğunu ve karşılaştırılabilir boyut aralığında büyük dil modellerinden (LLM) daha iyi performans gösterdiğini iddia ediyor.

Liquid AI’nin Yeni Likit Fondöten Modelleri

Girişim, 2023 yılında Massachusetts Teknoloji Enstitüsü’nün (MIT) Bilgisayar Bilimi ve Yapay Zeka Laboratuvarı’ndaki (CSAIL) araştırmacılar tarafından ortaklaşa kuruldu ve benzer düzeyde performans gösterebilen veya GPT’leri geçebilen yapay zeka modelleri için daha yeni bir mimari oluşturmayı amaçladı. .

Bu yeni LFM’ler mevcut 1.3B, 3.1B ve 40.3B olmak üzere üç parametre boyutunda. İkincisi, Uzmanlar Karması (MoE) modelidir; bu, çeşitli küçük dil modellerinden oluştuğu ve daha karmaşık görevlerin üstesinden gelmeyi amaçladığı anlamına gelir. LFM’ler artık şirketin Liquid Playground’unda, Sohbet Kullanıcı Arayüzü ve API’si için Lambda’da ve Perplexity Labs’de mevcut ve yakında Cerebras Inference’a eklenecek. Ayrıca şirket, AI modellerinin Nvidia, AMD, Qualcomm, Cerebras ve Apple donanımı için optimize edildiğini belirtti.

LFM’ler ayrıca GPT teknolojisinden önemli ölçüde farklıdır. Şirket, bu modellerin ilk ilkelerden yola çıkılarak oluşturulduğunu vurguladı. İlk ilkeler, esas olarak, karmaşık bir teknolojinin temellerine bölündüğü ve oradan inşa edildiği bir problem çözme yaklaşımıdır.

Girişime göre, bu yeni yapay zeka modelleri hesaplama birimleri adı verilen bir şey üzerine inşa ediliyor. Basitçe söylemek gerekirse bu, token sisteminin yeniden tasarlanmasıdır ve bunun yerine şirket Liquid sistemi terimini kullanır. Bunlar, bilgi kapasitesini ve akıl yürütmeyi en üst düzeye çıkarmaya odaklanan yoğunlaştırılmış bilgiler içerir. Girişim, bu yeni tasarımın çıkarım sırasında bellek maliyetlerini azaltmaya yardımcı olduğunu ve video, ses, metin, zaman serisi ve sinyaller genelinde performans çıktısını artırdığını iddia ediyor.

Şirket ayrıca Liquid tabanlı AI modellerinin avantajının, mimarisinin belirli bir platform için gereksinimlerine ve çıkarım önbellek boyutuna göre otomatik olarak optimize edilebilmesi olduğunu iddia ediyor.

Startup tarafından üretilen istiridyeler uzun olsa da performansları ve verimlilikleri ancak geliştiriciler ve kuruluşlar bunları yapay zeka iş akışları için kullanmaya başladıkça ölçülebilir. Başlangıç, veri kümelerinin kaynağını veya AI modellerine eklenen herhangi bir güvenlik önlemini açıklamadı.



genel-8