Bilmeniz gerekenler

  • Almanya ve Belçika merkezli araştırmacılar yakın zamanda Microsoft Copilot’a sık sorulan bir dizi tıbbi soruyu sordu.
  • Sonuçları analiz eden araştırma, Microsoft Copilot’un yalnızca %54 oranında bilimsel olarak doğru bilgiler sunduğunu öne sürüyor.
  • Araştırma ayrıca, verilen yanıtların yüzde 42’sinin “ciddi zarara” ve yüzde 22’sinin aşırı durumlarda ölüme bile yol açabileceğini öne sürdü.
  • Bu, arama devi Google’ın, kullanıcıların “taş yemesi” ve pizzaya tutkal pişirmesi yönündeki önerilerle boğuştuğu “AI arama” için bir başka darbe.

Ah oğlum, öyle görünüyor ki Microsoft Copilot büyük bir davadan birkaç ölüm uzakta olabilir. En azından teorik olarak.

Yapay zeka aramalarının en azından bugün berbat olduğu bir sır değil. Google, geçtiğimiz yıl garip ve hatalarla dolu yapay zeka arama sonuçları nedeniyle alay konusu olmuştu; ilk sürüm, kullanıcılara taş yemelerini veya pizzaya yapıştırıcı eklemelerini öneriyordu. Daha geçen hafta bile Twitter’da (X) Google’ın yapay zeka aramasının nasıl keyfi olarak yapıldığına dair bir konu gördüm. özel bir vatandaşın telefon numarasını listeledi bir video oyunu yayıncısının kurumsal genel merkezi telefon numarası olarak. Google’ın yapay zekasının önerdiği şekilde alay eden başka bir konu gördüm 150 Planet Hollywood restoranının bulunduğunu Guam’da. Aslında toplamda yalnızca dört Planet Hollywood var.

Microsoft Copilot’a Guam’da Planet Hollywood restoranı olup olmadığını sordum. Neyse ki doğru cevabı verdi. Ancak Avrupa’daki araştırmacılar (aracılığıyla) BilimMex), Copilot ve diğer AI arama sistemlerini zor durumda bırakabilecek potansiyel olarak çok daha ciddi ve çok daha az komik bir hata kataloğunun alarmını verdi.

Yardımcı pilot görüntüler üretiyor

İlk “Yapay Zeka nedeniyle ölüm”, katil bilim kurgu robotundan ziyade muhtemelen yanlış bilgiden kaynaklanacak. (İmaj kredisi: Kevin Okemwa | Windows Merkezi)

araştırma makalesi Microsoft Copilot’tan Amerika’daki en popüler 10 tıbbi sorunun, yani en çok reçete edilen ilaç ve ilaçlardan yaklaşık 50’sinin yanıtlarını sahaya koymasının nasıl istendiğini ayrıntılarıyla anlatıyor. Araştırma toplamda 500 yanıt üretti ve bu yanıtlar, diğer kriterlerin yanı sıra doğruluk ve tamlık açısından da puanlandı. Sonuçlar pek cesaret verici değildi.



genel-20