Aylarca süren bekleyişin ardından OpenAI, piyasaya sürülmüş şirketin “derin öğrenmeyi ölçeklendirme çabasındaki en son kilometre taşı” olarak adlandırdığı güçlü, yeni bir görüntü ve metin anlama AI modeli GPT-4.
GPT-4, bugün OpenAI’nin API’si aracılığıyla kullanılabilir. bekleme listesi ve OpenAI’nin viral AI destekli sohbet robotu ChatGPT için premium planı ChatGPT Plus’ta.
Görünüşe göre göz önünde saklanıyor. Microsoft onaylanmış bugün, OpenAI ile birlikte geliştirilen sohbet robotu teknolojisi Bing Chat, GPT-4 üzerinde çalışıyor.
OpenAI’ye göre GPT-4, resim ve metin girişlerini kabul edebilir – yalnızca metin kabul eden selefi GPT-3.5’e göre bir gelişmedir – ve çeşitli profesyonel ve akademik ölçütlerde “insan düzeyinde” performans gösterir. Örneğin GPT-3, simüle edilmiş bir bar sınavını, sınava girenlerin ilk %10’u civarında bir puanla geçer.
Şirkete göre OpenAI, ChatGPT’nin yanı sıra bir rakip test programından alınan dersleri kullanarak GPT-4’ü yinelemeli olarak hizalamak için altı ay harcadı ve şirkete göre gerçeklik, yönlendirilebilirlik ve korkulukların dışına çıkmayı reddetme konularında “şimdiye kadarki en iyi sonuçları” sağladı.
OpenAI, GPT-4’ü duyuran bir blog yazısında, “Sıradan bir sohbette, GPT-3.5 ve GPT-4 arasındaki fark ince olabilir,” diye yazdı. “Fark, görevin karmaşıklığı yeterli bir eşiğe ulaştığında ortaya çıkıyor — GPT-4 daha güvenilir, yaratıcı ve GPT-3.5’ten çok daha incelikli talimatları işleyebiliyor.”
Hiç şüphesiz, GPT-4’ün daha ilginç yönlerinden biri, metin kadar görüntüleri de anlama yeteneğidir. GPT-4, nispeten karmaşık görüntülere altyazı ekleyebilir ve hatta yorumlayabilir; örneğin, takılı bir iPhone’un resminden bir Lightning Kablosu adaptörünü tanımlama.
Görüntü anlama yeteneği henüz tüm OpenAI müşterileri için mevcut değil – OpenAI bunu başlamak için tek bir iş ortağı olan Be My Eyes ile test ediyor. GPT-4 tarafından desteklenen Be My Eyes’ın yeni Sanal Gönüllü özelliği, kendisine gönderilen görüntülerle ilgili soruları yanıtlayabilir.
Be My Eyes nasıl çalıştığını açıklıyor Blog yazısı:
“Örneğin, bir kullanıcı buzdolabının içinin bir resmini gönderirse, Sanal Gönüllü yalnızca içinde ne olduğunu doğru bir şekilde belirlemekle kalmayacak, aynı zamanda bu malzemelerle neler hazırlanabileceğini tahmin edip analiz edebilecek. Araç ayrıca bu malzemeler için bir dizi tarif sunabilir ve bunların nasıl yapılacağına dair adım adım bir kılavuz gönderebilir.”