OpenAI, Perşembe günü en son küçük AI modeli olan GPT-4o mini’yi tanıttı. Şirket, GPT-4o miniOpenAI’nin mevcut son teknoloji AI modellerinden daha ucuz ve daha hızlı olan , bugün itibarıyla geliştiriciler için ve tüketiciler için ChatGPT web ve mobil uygulaması aracılığıyla yayınlanıyor. Kurumsal kullanıcılar önümüzdeki hafta erişim kazanacak.

Şirket, GPT-4o mini’nin metin ve görme içeren akıl yürütme görevlerinde sektör lideri küçük AI modellerinden daha iyi performans gösterdiğini söylüyor. Küçük AI modelleri geliştikçe, GPT-4 Omni veya Claude 3.5 Sonnet gibi daha büyük modellere kıyasla hızları ve maliyet verimlilikleri nedeniyle geliştiriciler arasında daha popüler hale geliyorlar. Geliştiricilerin tekrar tekrar bir AI modelini gerçekleştirmesi için çağırabileceği yüksek hacimli, basit görevler için kullanışlı bir seçenektirler.

GPT-4o mini, OpenAI’nin sunduğu en küçük model olarak GPT-3.5 Turbo’nun yerini alacak. Şirket, en yeni AI modelinin, Gemini 1.5 Flash için %79 ve Claude 3 Haiku için %75’e kıyasla, muhakemeyi ölçmek için bir ölçüt olan MMLU’da %82 puan aldığını iddia ediyor. Yapay AnalizMatematiksel muhakemeyi ölçen MGSM’de GPT-4o mini %87 puan alırken, Flash %78, Haiku ise %72 puan aldı.

Yapay Analizden küçük AI modellerini karşılaştıran grafik. Buradaki fiyat, giriş ve çıkış tokenlerinin birleşimidir.
Resim Kredileri: Yapay Analiz

Ayrıca, OpenAI, GPT-4o mini’nin önceki frontier modellerinden çalıştırmanın önemli ölçüde daha uygun fiyatlı olduğunu ve GPT-3.5 Turbo’dan %60’tan daha ucuz olduğunu söylüyor. Bugün, GPT-4o mini API’de metin ve görüntüyü destekliyor ve OpenAI, modelin gelecekte video ve ses yeteneklerini destekleyeceğini söylüyor.

“Dünyanın her köşesinin AI ile güçlendirilmesi için modelleri çok daha uygun fiyatlı hale getirmemiz gerekiyor,” dedi OpenAI’nin Ürün API’si başkanı Olivier Godement, TechCrunch ile yaptığı bir röportajda. “GPT-4o mini’nin bu yönde gerçekten büyük bir adım olduğunu düşünüyorum.”

OpenAI’nin API’sini geliştiren geliştiriciler için GPT4o mini, milyon girdi token’ı başına 15 sent ve milyon çıktı token’ı başına 60 sent olarak fiyatlandırılır. Modelin 128.000 token’lık bir bağlam penceresi vardır, bu da yaklaşık olarak bir kitabın uzunluğudur ve Ekim 2023’te bir bilgi kesintisi vardır.

OpenAI, GPT-4o mini’nin tam olarak ne kadar büyük olduğunu açıklamadı, ancak Llama 3 8b, Claude Haiku ve Gemini 1.5 Flash gibi diğer küçük AI modelleriyle hemen hemen aynı seviyede olduğunu söyledi. Ancak şirket, LMSYS.org chatbot arenasında yapılan lansman öncesi testlere dayanarak GPT-4o mini’nin endüstri lideri küçük modellerden daha hızlı, daha uygun maliyetli ve daha akıllı olduğunu iddia ediyor. Erken bağımsız testler bunu doğruluyor gibi görünüyor.

Yapay Analiz’in Kurucu Ortağı George Cameron, TechCrunch’a gönderdiği bir e-postada, “Karşılaştırılabilir modellere göre GPT-4o mini çok hızlıdır ve saniyede 202 token’lık bir ortalama çıktı hızına sahiptir,” dedi. “Bu, GPT-4o ve GPT-3.5 Turbo’dan 2 kat daha hızlıdır ve birçok tüketici uygulaması ve LLM’leri kullanmaya yönelik aracı yaklaşımlar dahil olmak üzere hıza bağlı kullanım durumları için ilgi çekici bir teklif sunar.”

Ayrı olarak, OpenAI Perşembe günü kurumsal müşteriler için yeni araçlar duyurdu. Blog yazısıOpenAI, finans, sağlık, hukuk hizmetleri ve hükümet gibi sıkı düzenlemelere tabi sektörlerdeki işletmelerin günlük kaydı ve denetim gerekliliklerine uymasına yardımcı olmak için Kurumsal Uyumluluk API’sini duyurdu.

Şirket, bu araçların yöneticilerin ChatGPT Enterprise verilerini denetlemelerine ve bunlar üzerinde işlem yapmalarına olanak tanıyacağını söylüyor. API, konuşmalar, yüklenen dosyalar, çalışma alanı kullanıcıları ve daha fazlası dahil olmak üzere zaman damgalı etkileşimlerin kayıtlarını sağlayacak.

OpenAI ayrıca yöneticilere çalışma alanı GPT’leri için daha ayrıntılı bir kontrol sağlıyor, belirli iş kullanım durumları için oluşturulmuş özel bir ChatGPT sürümü. Daha önce, yöneticiler yalnızca çalışma alanlarında oluşturulan GPT eylemlerine tam olarak izin verebilir veya bunları engelleyebilirdi, ancak artık çalışma alanı sahipleri GPT’lerin etkileşime girebileceği onaylanmış etki alanı listesi oluşturabilir.



genel-24