Toplamda, sekiz farklı AI chatbot test edildi ve ortalama olarak zamanın% 60’ı yanlış kaynağı ürettiler. Şaşkınlık en iyi performans gösterdi – ve yine de atıfın% 37’sini yanlış anladı. En kötü performans sergiledi, zamanın% 94’ü yanlıştı.
Araştırmacılar, AI araçlarının çoğunun yanlış cevaplar üretmesine rağmen, onlara hala büyük bir güven sunduklarını belirtiyorlar. Bu özellikle AI Chatbots’un ücretli sürümleri için geçerliydi. Araştırmacılar ayrıca AI Chatbots’un web örümceklerinin genellikle yayıncıların saygı duymaları gereken ödeme duvarlarını görmezden geldiğine dair kanıtlar buldular.


