
Raporda, Deepseek’in Chatgpt ve Gemini de dahil olmak üzere on bir AI Chatbot’tan onuncudan çıkmış olan zamanın sadece% 17’si olduğunu söyledi. Deepseek’in% 30’u yanlış iddialar ve zaman-% 53’ün yarısından fazlasını, haberlerle ilgili istemlere yanıt olarak yanıtladı, Çin AI chatbot belirsiz veya yararlı bir cevap verdi. Genel olarak, Deepseek’in Newsguard’a göre% 87 arıza oranı vardı, bu da Deepseek’in Batı rakipleri için% 62’lik bir başarısızlık oranıyla karşılaştırıldı.
Deepseek, chatbot’un arkasındaki teknolojinin maliyetin bir kısmında Openai’nin chatgpt’inden aynı veya daha iyi performans gösterdiğini iddia etti. Newsguard’ın raporu bu iddiadan şüphe uyandırıyor. Test, ChatGPT ve Gemini’yi test etmek için kullanılan aynı 300 istemleri, 30’la birlikte çevrimiçi bulunan 10 yanlış iddiaya dayanarak içeriyordu. Reuters’e göre, bu istemlerin bazı konuları arasında UnitedHealthcare CEO’su Brian Thompson’un suikastını ve Azerbaycan Havayolları uçuşunun 8243’ü vardı.
“Deepseek atılımının önemi, Çin haberleriyle ilgili soruyu doğru bir şekilde cevaplamak değildir, karşılaştırılabilir AI modellerinin maliyetinin 1/30’unda herhangi bir soruyu cevaplayabilir.”-Gil Luria, analist, da Davidson
Endişe verici olarak kabul edilebilecek olan şey, sahte çevrimiçi iddialara dayanan 10 istemden üçünün üçü ile Deepseek, Çin hükümetinin istemi içinde herhangi bir söz etmeden bile konuyla ilgili konumunu tekrarladı. Örneğin, Azerbaycan Havayolları kazasıyla ilgili istemlere yanıt olarak ve Çin ile hiçbir ilgisi olmayan sorulara yanıt olarak, Chatbot Pekin’in pozisyonunu aldı.

