OpenAI’nin büyük bir şey üzerinde çalıştığına dair söylentiler son birkaç haftadır artıyor ve CEO Sam Altman da bunu açıkladı. X’e (eski adıyla Twitter) götürüldü Bunun GPT-5 (çığır açan büyük dil modelleri serisinin bir sonraki yinelemesi) veya Google’a rakip olacak bir arama motoru olmayacağını doğrulamak için. Bu destanın en sonuncusu olan yeni bir rapor, OpenAI’nin yerleşik ses ve görsel işlemeye sahip daha gelişmiş bir AI modelini piyasaya sürmek üzere olabileceğini öne sürüyor.
OpenAI yapay zeka yarışının ön sıralarında yer alıyor ve insanlarla benzer şekilde iletişim kurmaya mümkün olduğunca yaklaşan, bizimle metnin yanı sıra ses kullanarak da konuşabilen ve ayrıca görüntüleri ve nesneleri tanıyabilir.
Bu iddia edilen yeni modeli detaylandıran rapor geliyor Bilgi’denGörünüşe göre bu yeni yeteneklerin bazılarını gösteren iki isimsiz kaynakla konuştu. Yeni modelin şu anda halka açık olanlardan daha iyi mantıksal akıl yürütmeye sahip olduğunu ve metni konuşmaya dönüştürebildiğini iddia ediyorlar. Bunların hiçbiri OpenAI için yeni değil, ancak yeni olan tüm bu işlevlerin söylentilere göre çok modlu modelde birleştirilmesi.
Multimodal bir model, metin, resim, ses ve video gibi birden fazla modalitede bilgi anlayabilen ve üretebilen bir modeldir. GPT-4 aynı zamanda metin ve görüntüleri işleyip üretebilen çok modlu bir modeldir ve bu yeni model teorik olarak yetenekler listesine sesin yanı sıra görüntülerin daha iyi anlaşılmasını ve daha hızlı işlem sürelerini de ekleyecektir.
OpenAI’nin aklındaki büyük resim
Bilgiler, Altman’ın OpenAI ürünlerine yönelik gelecekteki vizyonunu, “Her” filmindeki kurgusal yapay zeka gibi performans gösteren, oldukça duyarlı bir yapay zekanın geliştirilmesini içerecek şekilde tanımlıyor. Altman, henüz mümkün olmayan şeyleri başarabilecek görsel ve işitsel yeteneklere ve bu tür asistanların örneğin öğrencilere öğretmen olarak hizmet etmelerine olanak sağlayacak türden yanıt verme yeteneğine sahip dijital yapay zeka asistanlarını öngörüyor. Veya insanlara çevreleri veya mevcut durum hakkında en alakalı ve yararlı bilgileri anında verebilen nihai navigasyon ve seyahat asistanı.
Teknoloji aynı zamanda Apple’ın Siri’si gibi mevcut sesli asistanları geliştirmek ve örneğin konuştukları bir kişinin alaycı davrandığını tespit edebilen yapay zeka destekli müşteri hizmetleri temsilcilerinin daha iyi bir şekilde kullanılmasına olanak sağlamak için de kullanılabilir.
Yeni modelle ilgili deneyimi olanlara göre OpenAI, tam olarak ne zaman bilinmese de ödeme yapan abonelerin kullanımına sunacak. Görünüşe göre OpenAI, yeni özellikleri eninde sonunda chatbot’u ChatGPT’nin ücretsiz sürümüne dahil etmeyi planlıyor.
OpenAI’nin ayrıca yeni modeli şu anda mevcut olan en gelişmiş model olan GPT-4 Turbo’dan daha ucuz hale getirmek için çalıştığı bildiriliyor. Yeni modelin, pek çok sorgu türüne yanıt verme konusunda GPT-4 Turbo’dan daha iyi performans gösterdiği söyleniyor ancak görünen o ki, bu gibi modellerde yaygın bir sorun olan halüsinasyonlara hâlâ yatkın.
Şirket tutuyor bugün bir etkinlik OpenAI’nin bu gelişmiş modelin ön izlemesini yapabileceği 10:00 PT / 13:00 ET / 18:00 BST (veya 14 Mayıs Salı günü Avustralya’da 03:00 AEST). Eğer bu gerçekleşirse, OpenAI’nin en büyük rakiplerinden biri olan Google üzerinde büyük bir baskı oluşacaktır.
Google, 14 Mayıs’ta kendi yıllık geliştirici konferansı I/O 2024’ü düzenliyor ve bunun gibi büyük bir duyuru, özellikle Google’ın yapay zeka çabası Gemini söz konusu olduğunda, Google’ın açıklayacağı her şeyden çok fazla fırtına çalabilir.