
ChatGPT, yapılan bir çalışmada hastalıkların ve tıbbi durumların teşhisinde insan doktorlardan daha iyi performans göstermeyi başardı. Araştırmanın bulguları geçen ay yayınlandı ve yapay zeka (AI) sohbet robotlarının hasta geçmişlerini ve koşullarını analiz etmede ve daha doğru teşhisler sağlamada daha etkili olabileceğini vurguladı. Çalışma, AI sohbet robotlarının doktorların daha iyi teşhisler koymasına yardımcı olup olamayacağını anlamayı amaçlasa da, sonuçlar beklenmedik bir şekilde OpenAI’nin GPT-4 destekli sohbet robotunun, bir doktorla eşleştirildiğinde insan yardımı olmadan performans gösterdiğinde çok daha iyi performans gösterdiğini ortaya çıkardı.
ChatGPT, Hastalık Teşhis Konusunda Doktorları Geride Bırakıyor
çalışmakJAMA Network Open dergisinde yayınlanan araştırma, bir grup araştırmacı tarafından Boston’daki Beth Israel Deaconess Tıp Merkezi’nde gerçekleştirildi. Deney, yapay zekanın doktorların geleneksel yöntemlere kıyasla hastalıkları daha iyi teşhis etmesine yardımcı olup olamayacağını bulmayı amaçlıyordu.
New York Times’a göre raporDeney, asistanlar ve tıp fakültesine devam eden doktorların karışımından oluşan 50 doktoru içeriyordu. ABD’deki çok sayıda büyük hastane sistemi aracılığıyla işe alındılar ve onlara altı hasta vaka geçmişi verildi. Bildirildiğine göre deneklerden her vaka için bir tanı önermeleri ve neden bazı tanıları tercih ettikleri veya dışladıklarına dair bir açıklama yapmaları istendi. Doktorların, nihai teşhislerinin doğru olup olmadığına göre de derecelendirileceği söylendi.
Katılımcıların her birinin performansını değerlendirmek için, tıp uzmanlarının not verenler olarak seçildiği bildirildi. Cevapların kendilerine gösterileceği söylenirken, yanıtın yapay zekaya erişimi olan bir doktordan mı, sadece doktordan mı, yoksa sadece ChatGPT’den mi geldiği onlara söylenmedi.
Dahası, gerçekçi olmayan vaka geçmişleri olasılığını ortadan kaldırmak için araştırmacıların, onlarca yıldır araştırmacılar tarafından kullanılan ancak kontaminasyonu önlemek için hiçbir zaman yayınlanmayan gerçek hastaların vaka geçmişlerini seçtikleri bildirildi. Bu nokta önemlidir çünkü ChatGPT daha önce yayınlanmamış veriler üzerinde eğitilemez.
Araştırmanın bulguları şaşırtıcıydı. Vaka geçmişlerini teşhis etmek için herhangi bir yapay zeka aracı kullanmayan doktorlar ortalama yüzde 74 puan alırken, chatbot’u kullanan doktorlar ortalama yüzde 76 puan aldı. Ancak ChatGPT tek başına vaka geçmişlerini analiz edip teşhis sağladığında ortalama yüzde 90 puan aldı.
Doktorların deneyim düzeyinden belirli teşhislerdeki bireysel önyargılara kadar çeşitli faktörler çalışmanın sonucunu etkilemiş olabilirken, araştırmacılar, çalışmanın tıbbi kurumlardaki yapay zeka sistemlerinin potansiyelinin göz ardı edilemeyeceğini vurguladığına inanıyor.

