- OpenAI resmi olarak ilk AI Ajanını başlattı: Operatör
- Görevleri sizin için tamamlamak üzere bir web tarayıcısında çalışır ve şu anda sınırlı bir araştırma önizlemesi olarak yayındadır
- Operatör akşam yemeği rezervasyonu yapabilir, form doldurabilir ve diğer web görevlerini tamamlayabilir
OpenAI her zaman ChatGPT’ye eklenecek bir sonraki büyük şeyi arıyor ve bu hafta başlarında lansmana ilişkin bir rapor da dahil olmak üzere aylarca süren söylentilerin ardından teknoloji devinin ilk AI Temsilcisi burada. Operatör, tek bir düğmeye dokunarak web görevlerini sizin için tamamlayacak şekilde tasarlanmıştır.
Temel olarak Operatör, web’e göz atmak ve arama yapmak için GPT-4o’nun görsel becerilerini kullanan bir Bilgisayar Kullanan Aracıdır (CUA). Bu, neyin aranacağının bağlamını anlayabildiği ve çoklu mod özelliği sayesinde, arama yaparken gördüğünü anladığı anlamına gelir. Şu anda Amerika Birleşik Devletleri’ndeki ChatGPT Pro aboneleri için bir araştırma önizlemesi olarak mevcut.
Operatör, “sizin yerinize görevleri gerçekleştirmek için kendi tarayıcısını kullanabilen bir temsilci” olarak tanımlanıyor. OpenAI, Operatörün bizim (yani biz insanların) internette gezindiğini gösteren bir demo yayınladı. Operatörden, sizin için akşam yemeği rezervasyonu yaptırmasını isteyebilirsiniz. Siz, zorlu bir form doldurun, bir servisten yiyecek siparişi verin, hatta bir uçuş rezervasyonu yapın. Operatör, demoda gösterildiği gibi, bir restoranda rezervasyon yapmak için OpenTable’ı kullanabilir.
Operatör bir ‘araştırma önizlemesidir’, dolayısıyla henüz ilk günlerinde olduğunu bilin. OpenAI bazı sınırlamalar getirmektedir. Henüz uygulamalı çalışma şansımız olmadı ama kesinlikle etkileyici görünüyor. Bu, OpenAI’nin yapay zeka dünyasında muhtemelen yılın teması olacak yapay zeka ajanları dünyasına ilk girişidir.
OpenAI şunu yazıyor: blog yazısı Operatöre bunun “sizin için bağımsız olarak iş yapabilen yapay zekalar olan ilk ajanlarımızdan biri olduğunu, ona bir görev verirseniz o da onu yerine getirecektir” diye duyuruyor. Bu, yalnızca projede başka ajanların da bulunduğunu değil – Altman bunu canlı demo sırasında doğruladı – aynı zamanda hepsinin sizin için bir şeyler yapma fikrine dayandığını gösteriyor – yapay zekayı daha da yararlı hale getirme arayışında büyük bir adım, bize biraz zaman kazandırıyor.
Operatör, GPT4o’nun görüş becerilerini gelişmiş akıl yürütmeyle eşleştiren yeni Bilgisayar Kullanan Aracı (CUA) modeli tarafından desteklenmektedir. Bunların hepsi, Operatörün tarayıcı içindeki öğeleri (arama çubuğu, çeşitli düğmeler ve ekran içeriği) anlamasına ve kullanmasına olanak sağlamak için bir araya gelir.

OpenAI, “Operatörün bir tarayıcıyla ‘görebileceğini’ (ekran görüntüleri aracılığıyla) ve ‘etkileşimde bulunabileceğini’ (fare ve klavyenin izin verdiği tüm eylemleri kullanarak)”, bunun bir görevi tamamlamak için bir tarayıcıyı işlevsel olarak kullanmasına olanak sağladığını açıklıyor. Bu oldukça hoş, özellikle de yüksek bir başarı oranıyla çalışıyorsa ve blog yazısına göre kendi kendini düzeltebiliyorsa.
Ancak çoğu yeni yapay zeka aracı ve becerisinde olduğu gibi bunun da gerçek dünyada gerçekten kullanışlı hale gelmesi biraz zaman alacak. Bu aynı zamanda OpenAI’nin onu daha fazla kişiye açmasını gerektirecek, ancak erken bir araştırma önizlemesi olarak hala kesinlikle etkileyici bir demo.
Şimdilik Amerika Birleşik Devletleri’ndeyseniz ve ChatGPT Pro’ya abone olduysanız OpenAI’nin web sitesinde deneyebilirsiniz. OpenAI CEO’su Sam Altman, bunun eninde sonunda diğer ülkelere de geleceğini ve ChatGPT Plus aboneliğine ekleneceğini söyledi. OpenAI’nin 12 Günü’ndeki bazı duyurulardan hatırladığımız gibi, Avrupa’nın biraz daha uzun sürmesi muhtemel.


