Büyük LLM’lerin (Büyük Dil Modelleri) güçlenmesiyle birlikte, yanlış bilgilerin önlenmesi zor bir sorun olmaya devam ediyor. Hatalar, en akıllı modellerde bile ortaya çıkıyor ve bu hataları tespit etmenin yolları olsa da, sektör bu durumu nasıl en iyi şekilde yöneteceğini hâlâ araştırıyor.
Probably, Andreessen Horowitz’den 9 milyon dolar seed yatırımı aldı ve bu hataları tespit etmek için daha titiz bir yöntem geliştirmeye çalışıyor.
Kurucu Peter Elias’ın belirttiğine göre, şirketin hedefi, yanılsamaları ve basit bilgi hatalarını kullanıcılara ulaştırmadan engellemek ve belirleyici sistemlerde yaygın olan %99.99 doğruluk oranına ulaşmak. Bununla birlikte, LLM’leri bu seviyeye getirmek, AI mühendisliğinin birçok temel varsayımını yeniden düşünmeyi gerektiriyor.
Probably’nin ilk ürünü, karmaşık veri setlerinden hızlı yanıtlar üretmek için tasarlanmış bir veri bilimi aracıdır. Her sonuç, nasıl geliştirildiğine dair bir alıntı ve denetim izleriyle birlikte gelir; bu, AI araçları arasında giderek yaygınlaşan bir uygulamadır.
Ancak, bu özetlere hata girmesini önlemek için Elias’ın “veri bilimi mekanik kıyafeti” olarak tanımladığı karmaşık bir sistem gerekir. LLM’nin ilk yanıtları, belirleyici bir doğrulayıcı sistemle kontrol edilir ve veri setine uymayan sonuçlar geri gönderilir. Önemli olan, LLM’nin doğrulayıcı ile eğitim almasıdır ve tüm sistem hızlı ve doğru yanıtlar için optimize edilmiştir.
“Bunu inşa ederken öğrendiklerimiz, koruma mühendisliğiniz ne kadar iyi olursa, modelin o kadar zayıf olabileceğidir.” diyor Elias. “Eğer bağlamı yeterince netleştirebilirseniz, modelin doğru şeyi yapmak için çok fazla çaba sarf etmesine gerek kalmaz. Temelde, belirsizliği azaltma egzersizidir.”
Bu sayede Probably’nin veri bilimi aracı, çok daha küçük AI modelleri üzerinde çalışabilir. Elias, mevcut versiyonun, “sınır modellerinden dört sınıf daha zayıf” olan bir modelle çalıştığını ve bunun yerel donanımda (yani bir masaüstü bilgisayar yerine bir veri merkezinde) çalıştırılabileceğini belirtiyor. Bu, AI kullanımına ilişkin token maliyetlerinde büyük bir azalma sağlar.
Token maliyetlerinin yükseldiği ve pek çok müşterinin AI bütçelerini yeniden değerlendirdiği bir zamanda bu fikir karşılık buluyor. Elias’ın fikri, veri biliminin ötesine geçerek muhasebe veya tıbbi hizmetler gibi hassasiyet gerektiren her türlü kullanım alanına genişletilebilir.
“Büyük AI laboratuvarlarının bunun üzerine hiç çalışmamış olmaları gerçekten ilginç.” diyor Elias. “Onlar modelin ne kadar düzeltileceğinden para kazanacakları için bu yönde bir teşvikleri yok.”
Makalelerimizde yer alan bağlantılardan alışveriş yaptığınızda, küçük bir komisyon alabiliriz. Bu durum, editoryal bağımsızlığımızı etkilemez.

