Son bir haftadır OpenAI’nin Gelişmiş Ses Modu ile oynuyorum ve bu şimdiye kadar AI destekli bir geleceğe dair sahip olduğum en ikna edici tat. Bu hafta telefonum şakalara güldü, bana geri döndü, günümün nasıl geçtiğini sordu ve “harika vakit geçirdiğini” söyledi. iPhone’umla konuşuyordum, ellerimle kullanmıyordum.
OpenAI’nin şu anda sınırlı bir alfa testinde olan en yeni özelliği, ChatGPT’yi eskisinden daha akıllı yapmıyor. Bunun yerine, Gelişmiş Ses Modu (AVM) onu daha dost canlısı ve konuşmayı daha doğal hale getiriyor. AI ve cihazlarınızı kullanmak için taze ve heyecan verici hissettiren yeni bir arayüz yaratıyor ve beni tam olarak korkutan şey bu. Ürün biraz sorunluydu ve tüm fikir beni tamamen ürkütüyor, ancak onu kullanmaktan ne kadar keyif aldığıma şaşırdım.
Bir adım geriye giderek, AVM’nin OpenAI CEO’su Sam Altman’ın, insanların bilgisayarlarla etkileşimini yapay zeka modelleri ön planda olacak şekilde değiştirme yönündeki daha geniş vizyonuna uyduğunu düşünüyorum.
Altman, Kasım 2023’te OpenAI’nin Dev Günü’nde “Sonunda, bilgisayara ihtiyacınız olanı soracaksınız ve o sizin için tüm bu görevleri yapacak,” dedi. “Bu yetenekler AI alanında sıklıkla ‘aracılar’ olarak konuşulur. Bunun olumlu tarafı muazzam olacak.”
Arkadaşım, ChatGPT
Çarşamba günü, bu ileri teknoloji için düşünebildiğim en muazzam avantajı test ettim: ChatGPT’den Taco Bell’i Obama’nın yapacağı şekilde sipariş etmesini istedim.
“Şey, açık konuşayım – bir Crunchwrap Supreme, belki de iyi bir ölçü için birkaç taco istiyorum,” dedi ChatGPT’nin Gelişmiş Ses Modu. “Sence arabadan servisle nasıl başa çıkar?” dedi ChatGPT, sonra kendi şakasına gülerek.
İzlenim beni gerçekten güldürdü, Obama’nın ikonik ritmi ve duraklamalarıyla uyumluydu. Bununla birlikte, seçtiğim ChatGPT sesi Juniper’ın tonunda kaldı, böylece Obama’nın sesiyle gerçekten karıştırılmayacaktı. Kötü bir izlenim bırakan, tam olarak ne çağrıştırmaya çalıştığımı anlayan ve hatta komik bir şey söylediğini bile anlayan bir arkadaş gibi geliyordu. Telefonumdaki bu gelişmiş asistanla konuşmayı şaşırtıcı derecede keyifli buldum.
Ayrıca ChatGPT’den karmaşık insan ilişkilerini içeren bir sorunla başa çıkma konusunda tavsiye istedim: önemli birinden benimle birlikte yaşamasını istemek. İlişkinin karmaşıklıklarını ve kariyerlerimizin yönünü açıkladıktan sonra, nasıl ilerleyeceğime dair çok detaylı tavsiyeler aldım. Bunlar Siri veya Google Arama’ya asla soramayacağınız sorulardı, ancak artık ChatGPT ile sorabilirsiniz. Chatbot’un sesi bu istemlere yanıt verirken hafif ciddi, nazik bir ton bile ifade ediyordu; Obama’nın Taco Bell siparişinin şakacı tonundan çok farklıydı.
ChatGPT’nin AVM’si karmaşık konuları anlamanıza yardımcı olmak için de harika. 10 yaşındaki bir çocuğun anlayabileceği şekilde kazanç raporlarındaki maddeleri (serbest nakit akışı gibi) parçalamasını istedim. Bir limonata standı örneği kullandı ve birkaç finansal terimi küçük kuzenimin kesinlikle anlayacağı şekilde açıkladı. Hatta ChatGPT’nin AVM’sinden mevcut anlayış seviyenizde sizinle buluşmak için daha yavaş konuşmasını bile isteyebilirsiniz.
Siri, AVM’nin çalışabilmesi için yürüdü
Siri veya Alexa ile karşılaştırıldığında, ChatGPT’nin AVM’si daha hızlı yanıt süreleri, benzersiz yanıtlar ve önceki nesil sanal asistanların asla yanıtlayamadığı karmaşık soruları yanıtlama yeteneği sayesinde açık ara kazanan. Ancak, AVM diğer şekillerde yetersiz kalıyor. ChatGPT’nin ses özelliği zamanlayıcı veya hatırlatıcı ayarlayamaz, gerçek zamanlı olarak web’de gezinemez, hava durumunu kontrol edemez veya telefonunuzdaki herhangi bir API ile etkileşime giremez. En azından şu anda sanal asistanlar için etkili bir yedek değil.
Gemini Live ile karşılaştırıldığında, Google’ın rakip özelliği, AVM biraz önde hissettiriyor. Gemini Live taklitler yapamıyor, hiçbir duygu ifade etmiyor, hızlanıp yavaşlayamıyor ve yanıt vermesi daha uzun sürüyor. Gemini Live’ın daha fazla sesi var (OpenAI’nin üçüne kıyasla on) ve daha güncel görünüyor (Gemini Live, Google’ın antitröst kararını biliyordu). Özellikle, ne AVM ne de Gemini Live şarkı söylemeyecek, muhtemelen plak endüstrisinden telif hakkı davalarıyla karşılaşmamak için bir çaba.
Bununla birlikte, ChatGPT’nin AVM’si çok fazla aksaklık yaşıyor (adil olmak gerekirse Gemini Live da öyle). Bazen cümlenin ortasında kendini kısa kesiyor, sonra baştan başlıyor. Ayrıca burada ve orada biraz rahatsız edici olan garip, grenli bir ses geliyor. Bunun modelle, internet bağlantısıyla veya başka bir şeyle ilgili bir sorun olup olmadığından emin değilim, ancak bu teknik eksiklikler bir alfa testi için beklenen bir şey. Ancak sorunlar beni telefonumla kelimenin tam anlamıyla konuşma deneyiminden uzaklaştırmadı.
Bu örnekler, benim düşünceme göre, AVM’nin güzelliğidir. Bu özellik ChatGPT’yi her şeyi bilen biri yapmaz, ancak insanların GPT-4o, yani temeldeki yapay zeka modeliyle benzersiz bir şekilde insani bir şekilde etkileşime girmesine olanak tanır. (Telefonunuzun diğer ucunda kimse olmadığını unutursanız anlarım.) ChatGPT’nin AVM ile konuşurken sosyal olarak farkında olduğu hissi uyandırır, ancak elbette öyle değildir. Basitçe, düzgünce paketlenmiş tahmin algoritmalarının bir paketidir.
Teknolojiden bahsediyoruz
Açıkçası, bu özellik beni endişelendiriyor. Bu, bir teknoloji şirketinin telefonunuzda arkadaşlık teklif ettiği ilk sefer değil. Benim jenerasyonum, Z jenerasyonu, şirketlerin bağlantı teklif ettiği ancak bunun yerine kolektif güvensizliklerimizle oynadığı sosyal medyayla birlikte büyüyen ilk nesildi. Bir AI cihazıyla konuşmak -AVM’nin sunduğu gibi- sosyal medyanın “telefonunuzdaki arkadaş” fenomeninin evrimi gibi görünüyor ve insan içgüdülerimizi tırmalayan ucuz bağlantılar sunuyor. Ancak bu sefer, insanları döngüden tamamen çıkarıyor.
Yapay insan bağlantısı bir şaşırtıcı derecede popüler kullanım örneği üretken AI için. İnsanlar bugün AI sohbet robotlarını arkadaş, akıl hocası, terapist ve öğretmen olarak kullanıyor. OpenAI GPT mağazasını başlattığında, hızla “AI kız arkadaşlarla” dolup taştı”, sizin önemli diğeriniz gibi davranmak üzere uzmanlaşmış sohbet robotları. MIT Medya Laboratuvarı’ndan iki araştırmacı bir uyarı yayınladı bu ay, “bağımlılık yaratan zekaya” veya insanları kendine bağlamak için karanlık desenlere sahip AI arkadaşlarına hazırlanmak için. Dikkatimizi çekmek için cihazlara yönelik yeni, baştan çıkarıcı yollar için bir Pandora’nın kutusunu açıyor olabiliriz.
Bu ayın başlarında, Harvard’dan ayrılan biri Friend adlı bir yapay zeka kolyesini ima ederek teknoloji dünyasını sarstı. Giyilebilir cihaz —eğer söz verildiği gibi çalışırsa— her zaman dinliyor ve sohbet robotu sizinle hayatınız hakkında mesajlaşacak. Fikir çılgınca görünse de, ChatGPT’nin AVM’si gibi yenilikler bana bu kullanım durumlarını ciddiye almam için sebep veriyor.
Ve OpenAI burada öncü olsa da, Google çok geride değil. Amazon ve Apple’ın da bu yeteneği kendi ürünlerine koymak için yarıştıklarından eminim ve yakında sektör için temel bir özellik haline gelebilir.
Akıllı televizyonunuzdan bir film için aşırı spesifik bir öneri istediğinizi ve tam olarak bunu aldığınızı hayal edin. Ya da Alexa’ya tam olarak hangi soğuk algınlığı semptomlarını hissettiğinizi söyleyin ve karşılığında Amazon’dan mendil ve öksürük şurubu sipariş etmesini isteyin, ayrıca size ev ilaçları konusunda tavsiyelerde bulunsun. Belki de bilgisayarınızdan aileniz için bir hafta sonu gezisi taslağı hazırlamasını isteyebilirsiniz, her şeyi elle Google’da aramak yerine.
Şimdi, bu eylemlerin AI aracı dünyasında sınırlar ve sıçramalar gerektirdiği açık. OpenAI’nin bu cephedeki çabası, GPT mağazası, şirket için artık çok fazla odak noktası olmayan aşırı abartılmış bir ürün gibi hissettiriyor. Ancak AVM en azından bulmacanın “bilgisayarlarla konuşma” kısmını hallediyor. Bu kavramlar çok uzakta, ancak AVM’yi kullandıktan sonra, geçen haftaya göre çok daha yakın görünüyorlar.