Bir Reddit’te AMAOpenAI CEO’su Sam Altman, bilgi işlem kapasitesi eksikliğinin şirketin ürünleri istediği sıklıkta göndermesini engelleyen önemli bir faktör olduğunu itiraf etti.
OpenAI’nin bir sonraki yapay zeka modellerinin neden bu kadar uzun sürdüğüne ilişkin bir soruya yanıt olarak “Bu modellerin tümü oldukça karmaşık hale geldi” diye yazdı. “Aynı zamanda birçok kısıtlamayla ve zor kararlarla da karşı karşıyayız. [how] bilgi işlem gücümüzü birçok harika fikre ayırdık.”
Birçok raporlar OpenAI’nin üretken modellerini çalıştırmak ve eğitmek için yeterli bilgi işlem altyapısını güvence altına almakta zorlandığını öne sürüyor. Daha bu hafta Reuters, kaynaklara atıfta bulunarak OpenAI’nin aylardır Broadcom ile birlikte çalışan modeller için 2026 gibi kısa bir sürede gelebilecek bir AI çipi oluşturmak için çalıştığını söyledi.
Kısmen kısıtlı kapasitenin bir sonucu olarak Altman, OpenAI’nin ChatGPT için gerçekçi ses veren konuşma özelliği olan Gelişmiş Ses Modunun yakın zamanda Nisan ayında ilk kez tanıtılacak görüş yeteneklerine sahip olmayacağını söyledi. Nisan ayındaki basın etkinliğinde OpenAI, ChatGPT uygulamasının bir akıllı telefonda çalıştığını ve telefonun kamerasının görüş alanında birinin giydiği kıyafetler gibi görsel ipuçlarına yanıt verdiğini gösterdi.
Raporlama Fortune’dan daha sonra demonun, dikkatleri aynı hafta gerçekleşen Google’ın I/O geliştirici konferansından uzaklaştırmak için aceleye getirildiğini açıkladı. OpenAI içindeki pek çok kişi GPT-4o’nun tanıtılmaya hazır olduğunu düşünmüyordu. İlginç bir şekilde, Gelişmiş Ses Modunun yalnızca sesli sürümü aylarca ertelendi.
AMA’da Altman, OpenAI’nin görüntü oluşturucusunun bir sonraki büyük sürümü olan DALL-E’nin lansman zaman çizelgesinin olmadığını belirtti. (“Henüz bir yayın planımız yok” dedi.) Bu arada OpenAI’nin video oluşturma aracı Sora, “modeli mükemmelleştirme, güvenlik/kimliğe bürünme/diğer şeyleri doğru yapma ihtiyacı ve AMA’ya da katılan OpenAI’nin baş ürün sorumlusu Kevin Weil, “ölçekli hesaplama” diye yazdı.
Sora’nın Luma, Runway ve diğer rakip sistemlere karşı kendisini zayıf konumlandıran teknik aksaklıklar yaşadığı bildirildi. Başına Şubat ayında ortaya çıkan orijinal sistem olan Bilgi, 1 dakikalık bir video klip oluşturmak için 10 dakikadan fazla işlem süresi gerektirdi.
Ekim ayında Sora’nın yardımcı liderlerinden biri olan Tim Brooks Google’a gitti.
Daha sonra AMA’da Altman, OpenAI’nin “bir gün” ChatGPT’de “NSFW” içeriğine izin vermeyi düşündüğünü (“yetişkin kullanıcılara yetişkinler gibi davranılması gerektiğine tamamen inanıyoruz” diye yazdı) ve şirketin en büyük önceliğinin o1 serisini geliştirmek olduğunu söyledi. “Akıl yürütme” modelleri ve onların ardılları. OpenAI önizlendi Görüntü anlama da dahil olmak üzere bu hafta Londra’daki DevDay konferansında bir dizi özellik ilk kez tanıtılacak.
Altman, “Bu yılın sonlarında çok iyi yayınlarımız olacak” diye yazdı. “Ama GPT-5 diyeceğimiz bir şey yok.”