OpenAI için yönetici ayrılıkları ve büyük bağış toplama gelişmeleriyle dolu çalkantılı bir hafta oldu, ancak girişim geri döndü ve geliştiricileri 2024 DevDay’de yapay zeka modelleriyle araçlar oluşturmaya ikna etmeye çalışıyor. Şirket Salı günü, düşük gecikmeli, yapay zeka tarafından oluşturulan sesli yanıtlara sahip uygulamalar oluşturmaya yönelik “Gerçek Zamanlı API”nin halka açık beta sürümü de dahil olmak üzere birçok yeni aracı duyurdu. Tam olarak ChatGPT’nin Gelişmiş Ses Modu değil, ama buna yakın.

OpenAI baş ürün sorumlusu Kevin Weil, etkinlik öncesinde gazetecilere verdiği brifingde, baş teknoloji sorumlusu Mira Murati ve baş araştırma sorumlusu Bob McGrew’un son zamanlarda ayrılmalarının şirketin ilerlemesini etkilemeyeceğini söyledi.

“Bob ve Mira’nın harika liderler olduğunu söyleyerek başlayacağım. Onlardan çok şey öğrendim ve bugün bulunduğumuz noktaya gelmemizde onların büyük payı var” dedi Weil. “Ayrıca yavaşlamayacağız.”

OpenAI, geçen yılki DevDay’in ardından yaşanan çalkantıyı hatırlatan başka bir C-suite revizyonundan geçerken şirket, geliştiricileri hala AI uygulamaları geliştirmek için en iyi platformu sunduğuna ikna etmeye çalışıyor. Liderler, girişimin yapay zeka modellerini geliştiren 3 milyondan fazla geliştiriciye sahip olduğunu ancak OpenAI’nin giderek daha rekabetçi bir alanda faaliyet gösterdiğini söylüyor.

OpenAI, son iki yılda geliştiricilerin API’sine erişim maliyetlerini %99 oranında azalttığını, ancak bunun muhtemelen Meta ve Google gibi rakiplerin fiyatlarını sürekli düşürmesi nedeniyle zorlandığını belirtti.

OpenAI’nin Realtime API olarak adlandırılan yeni özelliklerinden biri, OpenAI tarafından sağlanan altı ses kullanma seçeneğiyle geliştiricilere uygulamalarında neredeyse gerçek zamanlı, konuşmadan konuşmaya deneyimler oluşturma şansı verecek. Bu sesler ChatGPT için sunulan seslerden farklıdır ve geliştiriciler, telif hakkı sorunlarını önlemek amacıyla üçüncü taraf sesleri kullanamaz. (Belirsiz bir şekilde Scarlett Johansson’a dayanan ses hiçbir yerde mevcut değil.)

Brifing sırasında OpenAI’nin geliştirici deneyimi başkanı Romain Huet, Realtime API ile oluşturulmuş bir gezi planlama uygulamasının demosunu paylaştı. Uygulama, kullanıcıların bir yapay zeka asistanıyla yaklaşan Londra gezisi hakkında sözlü olarak konuşmasına ve düşük gecikmeli yanıtlar almasına olanak tanıdı. Realtime API’nin ayrıca bir dizi araca erişimi var, bu nedenle uygulama, yanıt verirken restoran konumlarını içeren bir haritaya açıklama ekleyebildi.

Başka bir noktada Huet, Realtime API’nin bir etkinlik için yemek siparişi vermek üzere bir insanla telefonda nasıl konuşabildiğini gösterdi. Google’ın meşhur Duo’sunun aksine, OpenAI’nin API’si restoranları veya mağazaları doğrudan arayamaz; ancak bunu yapmak için Twilio gibi API’lerin çağrılması ile entegre olabilir. Özellikle, OpenAI Olumsuz Yapay zeka tarafından oluşturulan bu sesler oldukça gerçekçi görünse de, yapay zeka modellerinin bu tür aramalarda kendilerini otomatik olarak tanımlamasını sağlayacak açıklamalar ekliyor. Şimdilik, yeni Kaliforniya yasalarının gerektirebileceği bu açıklamayı eklemek geliştiricilerin sorumluluğunda gibi görünüyor.

OpenAI, DevDay duyurularının bir parçası olarak API’sinde, geliştiricilerin GPT-4o uygulamalarına ince ayar yapmak için metinlerin yanı sıra görselleri de kullanmalarına olanak tanıyan görsel ince ayar özelliğini de tanıttı. Bu, teorik olarak geliştiricilerin görsel anlayışı içeren görevlerde GPT-4o performansını artırmasına yardımcı olacaktır. OpenAI’nin ürün API’si başkanı Olivier Godement, TechCrunch’a geliştiricilerin telif hakkıyla korunan görüntüleri (Donald Duck’ın resmi gibi), şiddet içeren görüntüleri veya OpenAI’nin güvenlik politikalarını ihlal eden diğer görüntüleri yükleyemeyeceklerini söyledi.

OpenAI, AI modeli lisanslama alanındaki rakiplerinin halihazırda sunduklarıyla eşleşmek için yarışıyor. Hızlı önbelleğe alma özelliği, Anthropic’in birkaç ay önce başlattığı özelliğe benzer; geliştiricilerin API çağrıları arasında sık kullanılan bağlamı önbelleğe almasına, maliyetleri düşürmesine ve gecikmeyi artırmasına olanak tanır. OpenAI, geliştiricilerin bu özelliği kullanarak %50 tasarruf sağlayabileceğini söylerken Anthropic yüzde 90 indirim vaat ediyor bunun için.

Son olarak OpenAI, geliştiricilerin o1-preview ve GPT-4o gibi daha büyük AI modellerini kullanarak GPT-4o mini gibi daha küçük modellere ince ayar yapmalarına olanak tanıyan bir model damıtma özelliği sunuyor. Daha küçük modellerin çalıştırılması, daha büyük modellerin çalıştırılmasına kıyasla genellikle maliyet tasarrufu sağlar, ancak bu özellik, geliştiricilerin bu küçük AI modellerinin performansını artırmasına olanak sağlamalıdır. Model ayrıştırmanın bir parçası olarak OpenAI, geliştiricilerin OpenAI’nin API’sindeki ince ayar performansını ölçebilmeleri için bir beta değerlendirme aracı başlatıyor.

DevDay, duyurmadığı şeylerle daha büyük ses getirebilir; örneğin, geçen yılın DevDay’inde GPT Store’da duyurulan herhangi bir haber yoktu. Son duyduğumuza göre OpenAI, GPT’lerin en popüler yaratıcılarından bazılarıyla bir gelir paylaşımı programı yürütüyor ancak şirket o zamandan bu yana pek bir açıklama yapmadı.

Ayrıca OpenAI, bu yıl DevDay sırasında herhangi bir yeni AI modeli yayınlamayacağını söylüyor. OpenAI o1’i (önizleme veya mini sürüm değil) veya girişimin video oluşturma modeli Sora’yı bekleyen geliştiricilerin biraz daha beklemesi gerekecek.



genel-24