BaşlangıçStanford bilgisayar bilimi profesörü Stefano Ermon tarafından başlatılan yeni bir Palo Alto merkezli şirket, “difüzyon” teknolojisine dayanan yeni bir AI modeli geliştirdiğini iddia ediyor. Başlangıç, buna difüzyon tabanlı bir büyük dil modeli veya kısaca bir “DLM” olarak adlandırılır.
Şimdi en çok dikkat çeken üretken AI modelleri geniş ölçüde iki türe ayrılabilir: büyük dil modelleri (LLMS) ve difüzyon modelleri. Llms, üzerine inşa edilmiş transformatör mimarisimetin oluşturma için kullanılır. Bu arada, Midjourney ve Openai’nin Sora gibi AI sistemlerini güçlendiren difüzyon modelleri esas olarak görüntü, video ve ses oluşturmak için kullanılır.
Şirkete göre, Inception’ın modeli, kod üretimi ve soru cevaplaması da dahil olmak üzere geleneksel LLM’lerin yeteneklerini sunuyor, ancak şirkete göre önemli ölçüde daha hızlı performans ve düşük bilgi işlem maliyetleri.
Ermon, TechCrunch’a Stanford laboratuvarında uzun süre metne difüzyon modellerinin nasıl uygulanacağını incelediğini söyledi. Araştırması, geleneksel LLM’lerin difüzyon teknolojisine kıyasla nispeten yavaş olduğu fikrine dayanıyordu.
LLMS ile, “Birincisini üretene kadar ikinci kelimeyi üretemezsiniz ve ilk ikisini üretene kadar üçüncü olanı üretemezsiniz” dedi Ermon.
Ermon, metne bir difüzyon yaklaşımı uygulamanın bir yolunu arıyordu, çünkü sırayla çalışan LLM’lerin aksine, difüzyon modelleri ürettikleri verilerin kaba bir tahmini (örn. Bir resim) ile başlıyor ve daha sonra verileri aynı anda odaklıyor.
Difüzyon modelleri ile paralel olarak büyük metin bloklarının üretilmesini ve değiştirilmesini varsayılan ermon mümkündür. Yıllarca denedikten sonra, Ermon ve bir öğrencisi, araştırma makalesi Geçen yıl yayınlandı.
İlerlemenin potansiyelini tanıyan Ermon, geçen yaz başlangıç kurdu, iki eski öğrenciye, UCLA profesörü Aditya Grover ve Cornell profesörü Volodymyr Kuleshov’a şirketin ortak liderliğine dokundu.
Ermon, Inception’ın finansmanını tartışmayı reddederken, TechCrunch Mayfield Fund’ın yatırım yaptığını anlıyor.
Başlangıç, AI, AI gecikmesi ve artan hızın azaltılmış kritik ihtiyaçlarını ele alarak isimsiz Fortune 100 şirketleri de dahil olmak üzere birçok müşteriyi güvence altına aldı.
“Bulduğumuz şey, modellerimizin GPU’ları çok daha verimli bir şekilde kullanabileceğidir,” dedi Ermon, üretimde modelleri çalıştırmak için yaygın olarak kullanılan bilgisayar yongalarına atıfta bulundu. “Bence bu çok önemli. Bu, insanların dil modelleri oluşturma biçimini değiştirecek. ”
Inception, bir API, şirket içi ve kenar cihazı dağıtım seçenekleri, model ince ayarlama desteği ve çeşitli kullanım durumları için bir dizi kutudan DLM sunmaktadır. Şirket, DLM’lerinin geleneksel LLM’lerden 10 kat daha hızlı çalışabileceğini ve 10 kat daha az maliyetli olabileceğini iddia ediyor.
“‘Küçük’ kodlama modelimiz [OpenAI’s] Bir şirket sözcüsü TechCrunch’a verdiği demeçte GPT-4O Mini. ”Dedi. “’Mini’ modelimiz küçük açık kaynaklı modellerden daha iyi performans gösterir [Meta’s] Lama 3.1 8b ve saniyede 1.000’den fazla jetona ulaşıyor. ”
“Jetonlar”, ham veri parçaları için endüstri parlantıdır. Saniyede bin jeton gerçekten etkileyici bir hızInception’ın iddialarının devam ettiği varsayılarak.

