ChatGPT interneti kasıp kavurmuş olabilir, ancak onunla etkileşim kurma şekliniz hâlâ çok sınırlıdır. Ancak geleceğin sohbet robotları bu kadar sınırlı olmayabilir. Aslında, mesaj yazmaya ve okumaya zorlanmak yerine, sözlü bir konuşma yapabileceğiniz insan benzeri avatarlara bile sahip olabilirler.
Bir şirketle, İsrail firması D-ID ile Barselona’daki Mobil Dünya Kongresi’nde bu olasılık hakkında konuştum. YAPTI (yeni sekmede açılır) tamamen dijital insanlar yaratmakla ilgili ve şu anda bu, AI sohbet botlarına daha insani bir bağlantı eklemek anlamına geliyor – yeni API’sinin piyasaya sürülmesiyle başarmayı umduğu bir şey.
Bu API, gerçek zamanlı akış yetenekleri sunarak sohbet robotuyla normal bir insan gibi konuşmanıza olanak tanır. Bu chatbot’un kendisi, metinden videoya teknolojisini kullanabilir ve dijital avatarının aslında bir insan sesiyle konuştuğu izlenimini verebilir. Elbette, bir makineyle konuşmaktansa yazmayı tercih ederseniz, bunun yerine yazmayı seçebilirsiniz.
Bir API olması, D-ID’nin sisteminin diğer uygulamalara ve hizmetlere entegre edilebileceği anlamına gelir. Genel fikir, işletmelerin, insanların daha kişisel bir düzeyde bağlantı kurabilecekleri sanal asistanlar oluşturması ve sunmasıdır – bu, yüz yönünün devreye girdiği yerdir.
D-ID CEO’su ve kurucu ortağı Gil Perry’ye göre, insanlar yalnızca metin veya sese dayanan konuşmalar için kablolu değiller. Bunun yerine, bir insan yüzüne (veya en azından onun bir temsiline) sahip olmak, her şeyi daha ilgi çekici ve doğal hale getirir – üstelik birden fazla dilde.
Artı, iş açısından bakıldığında, sizin için bir sürü şey yapan bir yapay zekaya sahip olmak, sizi gerçek insanları işe alma maliyetinden kurtarır. Bu, müşterilerle sohbet etmek, çalışanları eğitmek veya yapay zekaların mevcut durumlarıyla başa çıkabileceği başka herhangi bir şey olabilir.
Şu anda insanlar AI hakkında oldukça şüpheci ve temkinli olma eğilimindeler ve Perry, bu yüzsüz doğanın sebebin bir parçası olabileceğini öne sürdü. Bir insan yüzü eklemek, aramanın diğer ucunda bir insan olmadığını bilseler bile, insanların bir chatbot ile sohbet ederken daha rahat hissetmelerine yardımcı olabilir.
MWC’de yeni entegre akış yetenekleri de dahil olmak üzere çeşitli D-ID sohbet robotlarının bir demosunu gördüm. Farklı türden avatarları hareket halinde görmek kesinlikle ilginçti, ancak en gelişmişlerinde bile biraz esrarengiz bir vadi etkisi vardı.
Bu özellikle konuşma animasyonları için geçerliydi. Her şey tam olarak senkronize değildi ve bazen sesi seslendirmeye çalışan bir avatardan çok rastgele ağız çırpmaya benziyordu – ki aslında yapmıyor.
Bot insanlarla etkileşime girerken konuşma tanıma ve yazmada da birkaç belirgin gecikme fark ettim. Ancak bu, botla konuşabileceğiniz, ne söylediğinizi anlamasını sağlayabileceğiniz ve tek bir şey yazmak veya okumak zorunda kalmadan bir yanıt sunabileceğiniz gerçeğini değiştirmez.
Tek soru, bu tür bir deneyimin halka açık olup olmayacağı ve ne zaman sunulacağıdır. D-ID’nin amacı, API’sini işletmelere ve kurumsal kullanıcılara sunmaktır. Ancak, ChatGPT’nin popülaritesindeki son patlamada gördüğümüz gibi, bu tür bir teknolojinin daha halka açık bir alanda ortaya çıktığını görmemiz için iyi bir şans var. Özellikle MWC’de yer alan AI merkezli şirketlerin sayısı ve son haftalarda ortaya çıkan ChatGPT rakiplerinin sayısı göz önüne alındığında.