Bugüne kadar AI’nın bilmediği (veya cevaplamak istemediği) üç soru vardır: Size kim, ne kadar enerji tükettiğini ve ne dediğinizden emin olduğunuzdan ne dedi. Dördüncü soru daha da ilgi çekicidir: Haberlerin güvenilirliğini kontrol edebiliyor musunuz? Bir yanıt, Roma’nın Sapienza Üniversitesi’nden araştırmacılar tarafından büyük dil modellerini (LLM) karşılaştıran bir çalışma geliyor – büyük dilsel modeller, Google, Meta e openii ve yapılandırılmış insan uzmanlarının ekipleri büyük miktarda veri üzerinde eğitilmiş IA programları Newsguard ve Media Bias Fact Check (MBFC) gibi. “Sonuçlarımız, LLM’nin sınıflandırmaları ile özellikle insan olanlar arasında özellikle güvenilmez kaynakların tanımlanmasında güçlü bir uyum ortaya koymaktadır”. Başlıklı çalışma Juds’a Kod çözmek: LLM’ler burada bulduğunuz haberleri ve önyargıları nasıl değerlendirir? Google’ın Gemini 1.5 flaş modellerini, Openai tarafından GPT-4O Mini ve Meta’nın Lama 3.1’i inceledi. Bu modeller, komplo, sansasyonizm ve önyargılar teorilerini, uzmanlar tarafından değerlendirmelerinde kullanılan temel kriterlere aynada bir şekilde sınıflandırır. Bağlam sınırlı olduğunda daha az tutarlıdırlar. Buna ek olarak, “Siyasi alanda doğru medyanın daha güvenilmez olarak kabul edildiğini, büyük modellerin eğitim aşamasında önyargıları miras alabileceği hakkında sorular sorarak, en güvenilir merkezin en güvenilir merkezine dikkat etmek ilginç – yazıyor” . Genel olarak, araştırmacılar büyük modeller için yerel haberlere atıfta bulunan anahtar kelimelerin, gerçeklere veya nötr dile dayalı raporların genellikle bir güvenilirlik kavramı ile ilişkili olduğuna inanmaktadır. Aksine, güvenilmezlik genellikle, düşük güvenilirlik kaynaklarını tanımlamak için insan uzmanları tarafından kullanılan ortak kullanım göstergelerini yansıtan sansasyonizm, tartışmalar veya önyargılarla ilgili terimlerle karakterizedir. Ayrıca, ‘şeffaflık’, bilginin güvenilirliği veya güvenilirliği için en yaygın olarak değerlendirilen kriterler olarak ‘önyargı’ ortaya çıkar. “Çalışma – araştırmacıları sonuçlardaki açıklıyor – büyük dilsel modelleri sadece otomatik sınıflandırmalar olarak değil, bilişsel yapılardaki pencereler olarak hem insanın hem de makinenin temelini yeniden şekillendiriyor. Akıl yürütme süreçlerini analiz ederek, yapılandırılmış değerlendirmeyi simüle etme ve karmaşık yargı görevlerindeki insan bilişsel stratejileriyle karşılaştırma şeklinin anlayışına yaklaşıyoruz ».
Modeller, komplo, sansasyonellik ve önyargılar teorilerini, uzmanlar tarafından değerlendirmelerinde kullanılan temel kriterlere aynada bir şekilde sınıflandırır. Bağlam sınırlı olduğunda daha az tutarlıdırlar. Buna ek olarak, “araştırmacıların yazdığı – siyasi alanda doğru medyanın daha güvenilmez olduğu düşünüldüğünü, büyük modellerin eğitim aşamasında önyargıları miras alabileceği soruları gündeme getirerek en güvenilir merkezin en güvenilir merkeze göre olduğunu not etmek ilginçtir”.
Genel olarak, araştırmacılar büyük modeller için yerel haberlere atıfta bulunan anahtar kelimelerin, gerçeklere veya nötr dile dayalı raporların genellikle bir güvenilirlik kavramı ile ilişkili olduğuna inanmaktadır. Aksine, güvenilmezlik genellikle, düşük güvenilirlik kaynaklarını tanımlamak için insan uzmanları tarafından kullanılan ortak kullanım göstergelerini yansıtan sansasyonizm, tartışmalar veya önyargılarla ilgili terimlerle karakterizedir. Ayrıca, ‘şeffaflık’, bilginin güvenilirliği veya güvenilirliği için en yaygın olarak değerlendirilen kriterler olarak ‘önyargı’ ortaya çıkar.
“Çalışma – araştırmacıları sonuçlardaki açıklıyor – büyük dilsel modelleri sadece otomatik sınıflandırmalar olarak değil, bilişsel yapılardaki pencereler olarak hem insanın hem de makinenin temelini yeniden şekillendiriyor. Akıl yürütme süreçlerini analiz ederek, yapılandırılmış değerlendirmeyi simüle etme ve karmaşık yargı görevlerindeki insan bilişsel stratejileriyle karşılaştırma şeklinin anlayışına yaklaşıyoruz “.

