
ChatGPT yakında akıllı telefonunuzun kamerasına baktıktan sonra soruları yanıtlama yeteneğini kazanabilir. Bir rapora göre, OpenAI’nin Gelişmiş Ses Modunun bir parçası olan Canlı Video özelliğinin kanıtı, Android için en son ChatGPT beta uygulamasında tespit edildi. Bu yetenek ilk olarak Mayıs ayında AI firmasının Bahar Güncellemeleri etkinliği sırasında gösterildi. Chatbot’un akıllı telefonun kamerasına erişmesine ve kullanıcının çevresi hakkındaki soruları gerçek zamanlı olarak yanıtlamasına olanak tanıyor. Duygusal ses özelliği birkaç ay önce piyasaya sürülmüş olsa da şirket şu ana kadar Canlı Video özelliğinin olası bir çıkış tarihini açıklamadı.
ChatGPT Canlı Video Özelliği En Son Beta Sürümde Keşfedildi
Bir Android Yetkilisi rapor uygulamanın Android paket kiti (APK) sökme işlemi sırasında bulunan Canlı Video özelliğinin kanıtlarını ayrıntılı olarak açıkladı. Bu özelliğe ilişkin çeşitli kod dizeleri, Android için ChatGPT beta sürüm 1.2024.317’de görüldü.
Özellikle Canlı Video özelliği, ChatGPT’nin Gelişmiş Ses Modunun bir parçasıdır ve AI sohbet robotunun, sorguları yanıtlamak ve kullanıcıyla gerçek zamanlı olarak etkileşime geçmek için video verilerini gerçek zamanlı olarak işlemesine olanak tanır. Bununla ChatGPT, kullanıcının buzdolabına bakabilir, malzemeleri tarayabilir ve bir tarif önerebilir. Ayrıca kullanıcının ifadelerini analiz edebilir ve ruh halini ölçmeye çalışabilir. Bu, yapay zekanın daha doğal ve anlamlı bir şekilde konuşmasını sağlayan duygusal ses yeteneğiyle birleştirildi.
Rapora göre özellikle ilgili birden fazla kod dizisi görüldü. Böyle bir dizede, OpenAI’nin demo sırasında bu özellik için verdiği açıklamanın aynısı olan “ChatGPT’nin çevrenizi görüntülemesine ve sohbet etmesine izin vermek için kamera simgesine dokunun” ifadesi yer alıyor.
Diğer dizelerin, özelliğin gerçek zamanlı olarak çalışabileceğini ve az geliştirilmekte olan özelliğin büyük olasılıkla önce beta kullanıcılarına yayınlanacağını vurgulayan “Canlı kamera” ve “Beta” gibi ifadeler içerdiği bildiriliyor.
Başka bir kod dizisi, kullanıcıların canlı navigasyon veya kullanıcıların sağlığını veya güvenliğini etkileyebilecek kararlar için Canlı Video özelliğini kullanmamaları yönünde bir tavsiye de içeriyor.
Bu dizelerin varlığı, özelliğin yayınlanacağına işaret etmese de, sekiz aylık bir gecikmenin ardından ilk kez şirketin bu özellik üzerinde çalıştığına dair kesin bir kanıt bulundu. Daha önce OpenAI, kullanıcıları korumak için özelliğin ertelendiğini iddia etmişti.
Özellikle Google DeepMind, Mayıs ayındaki Google I/O etkinliğinde de benzer bir yapay zeka vizyon özelliğini sergiledi. Project Astra’nın bir parçası olan bu özellik, Gemini’nin cihazın kamerasını kullanarak kullanıcının çevresini görmesine olanak tanıyor.
Demoda, Google’ın yapay zeka aracı nesneleri doğru şekilde tanımlayabiliyor, mevcut hava koşullarını çıkarabiliyor ve hatta canlı video oturumunda daha önce gördüğü nesneleri hatırlayabiliyor. Mountain View merkezli teknoloji devi şu ana kadar bu özelliğin ne zaman tanıtılabileceğine dair bir zaman çizelgesi de vermedi.

