Microsoft, üretken yapay zeka modellerinden oluşan Phi ailesinin en yeni üyesini duyurdu.
Microsoft, Phi-4 olarak adlandırılan modelin önceki modellere göre birçok alanda, özellikle de matematik problemlerinin çözümünde geliştirilmiş olduğunu iddia ediyor. Bu kısmen eğitim verilerinin kalitesinin artmasının bir sonucudur.
Phi-4, Perşembe gecesi itibarıyla çok sınırlı erişime açıldı: yalnızca Microsoft’un yakın zamanda piyasaya sürülen sürümünde Azure AI Dökümhanesi geliştirme platformudur ve yalnızca bir Microsoft araştırma lisans sözleşmesi kapsamında araştırma amaçlıdır.
Bu, Microsoft’un 14 milyar parametre boyutuyla gelen en son küçük dil modelidir ve GPT-4o mini, Gemini 2.0 Flash ve Claude 3.5 Haiku gibi diğer küçük modellerle rekabet eder. Bu yapay zeka modelleri çoğu zaman daha hızlı ve daha ucuzdur ancak küçük dil modellerinin performansı son birkaç yılda giderek arttı.
Bu durumda Microsoft, Phi-4’ün performansındaki sıçramayı, insan tarafından oluşturulan içeriğin yüksek kaliteli veri kümelerinin yanı sıra “yüksek kaliteli sentetik veri kümelerinin” kullanımına ve bazı belirtilmemiş eğitim sonrası iyileştirmelere bağlamaktadır.
Birçok yapay zeka laboratuvarı bugünlerde sentetik veriler ve eğitim sonrası yapabilecekleri yeniliklere daha yakından bakıyor. Scale AI CEO’su Alexandr Wang şunları söyledi: bir tweet’te Perşembe günü, konuyla ilgili son birkaç haftadaki birçok raporu doğrulayan “eğitim öncesi bir veri duvarına ulaştık” açıklaması yapıldı.
Phi-4’ün, Sébastien Bubeck’in ayrılışının ardından piyasaya sürülen ilk Phi serisi modeli olması dikkat çekicidir. Daha önce Microsoft’ta Yapay Zeka Başkan Yardımcısı ve şirketin Phi modeli geliştirmesinde önemli bir isim olan Bubeck, sol Microsoft Ekim ayında OpenAI’ye katılacak.

