Wikipedia’da bir sorun var. Ve çok uzun zaman önce yeniden markalaştırılan Facebook Meta, sadece cevabı alabilir.

Yedekleyelim. Wikipedia, milyonlarca makaleden oluşan akıllara durgunluk verecek kadar büyük, çok dilli bir ansiklopedinin oluşturulmasına ve sürdürülmesine katkıda bulunan 100.000’den fazla gönüllü insan editörüyle insanlık tarihindeki en büyük ölçekli ortak projelerden biridir. Her ay Wikipedia’ya 17.000’den fazla yeni makale eklenirken, mevcut makaleler külliyatında sürekli olarak ince ayarlar ve değişiklikler yapılır. En popüler Wiki makaleleri, en son araştırmaları, içgörüleri ve en güncel bilgileri yansıtacak şekilde binlerce kez düzenlenmiştir.

Zorluk, elbette, doğruluktur. Wikipedia’nın varlığı, çok sayıda insanın olumlu bir şey yaratmak için bir araya gelebileceğinin kanıtıdır. Ancak, gerçekten yararlı olması ve doğrulanmamış iddialardan oluşan geniş bir grafiti duvarı olmaması için, Wikipedia makalelerinin gerçeklerle desteklenmesi gerekir. Alıntıların geldiği yer burasıdır. Fikir – ve çoğunlukla bu çok iyi çalışıyor – Wikipedia kullanıcılarının ve editörlerinin, ifadeleri kaynaklarına geri izleyen köprüler ekleyerek veya tıklayarak gerçekleri onaylayabilmeleridir.

Kaynak belirtilmeli

Örneğin, Başkan Barack Obama’nın girişindeki girişi onaylamak istiyorum. Vikipedi makalesi Obama’nın 1988’de Avrupa’ya ve ardından Kenya’ya gittiğini ve burada birçok baba akrabasıyla ilk kez tanıştığını belirtti. Tek yapmam gereken cümlenin alıntılarına bakmak ve tabii ki gerçeğin kontrol edildiğini doğrulayan üç ayrı kitap referansı var.

Buna karşılık, “alıntı gerekli” ifadesi muhtemelen tüm Wikipedia’daki en kötü iki kelimedir, çünkü tam olarak yazarın kelimeleri dijital eterden yaratmadığına dair hiçbir kanıt olmadığını öne sürüyorlar. Bir Wikipedia iddiasına eklenen “alıntı gerekli” kelimeleri, havada parmakla alıntı yaparken birine bir gerçeği söylemeye eşdeğerdir.

Yine de alıntılar bize her şeyi anlatmaz. Geçen yıl dünyanın en çok kazanan 23. teknoloji gazetecisi olduğumu ve bir zamanlar Dijital Eğilimler için makaleler yazmak için kazançlı bir modelleme kariyerinden vazgeçtiğimi söyleyecek olsaydım, bu yüzeysel olarak makul görünüyor çünkü desteklenecek köprüler var. benim hayallerim.

Köprülerin benim alternatif gerçeklerimi hiç desteklemediği, aksine Dijital Eğilimler’deki ilgisiz sayfalara yönlendirdiği gerçeği, yalnızca onları tıkladığınızda ortaya çıkıyor. Benimle hiç tanışmamış olan okuyucuların yüzde 99,9’u için, bu makaleyi bir dizi yanlış izlenimle bırakabilirler, bunlardan en azı, modelleme dünyasına giriş için şaşırtıcı derecede düşük engeldir. Nicholas Carr’ın “” olarak adlandırdığı şeyi giderek daha fazla etrafa sıçrattığımız, hiper bağlantılı bir aşırı bilgi yüklemesi dünyasında.sığ”, alıntıların varlığı, olgusal onaylar gibi görünmektedir.

Meta içeri girer

Ancak, iddiaları gerçekten destekleyen sayfalara bağlantı vermeseler bile, Wikipedia editörleri tarafından alıntılar eklenirse ne olur? Bir örnek olarak, Blackfeet Tribe üyesiyle ilgili yeni bir Wikipedia makalesi Joe Hipp Hipp’in WBA World Heavyweight unvanı için mücadele eden ilk Kızılderili boksör olduğunu anlattı ve uygun görünen bir web sayfasıyla bağlantı kurdu. Ancak söz konusu web sayfasında ne bokstan ne de Joe Hipp’ten bahsedildi.

Joe Hipp iddiası söz konusu olduğunda, alıntı uygunsuz olsa bile Wikipedia factoid’i doğruydu. Bununla birlikte, bunun yanlış bilgi yaymak için kasten veya başka türlü nasıl kullanılabileceğini görmek kolaydır.

Mark Zuckurburg, Facebook'un yeni adı Meta'yı tanıttı.

Meta, burada yardım etmenin bir yolunu bulduğunu düşünüyor. Wikimedia Vakfı ile birlikte çalışan Meta AI (sosyal medya devi için AI araştırma ve geliştirme araştırma laboratuvarı) iddia ettiği şeyi geliştirdi. ilk makine öğrenimi modeli ilgili iddiaları destekleyip desteklemediklerini kontrol etmek için yüz binlerce alıntıyı bir kerede otomatik olarak tarayabilir. Bu, Wikipedia’nın kullandığı ilk bottan çok uzak olsa da, en etkileyicileri arasında olabilir.

“Bence günün sonunda meraktan yola çıktık,” fabio petronik, Meta AI’nın FAIR (Temel Yapay Zeka Araştırması) ekibinin araştırma teknoloji baş yöneticisi Digital Trends’e verdiği demeçte. “Bu teknolojinin sınırının ne olduğunu görmek istedik. olup olmadığından kesinlikle emin değildik. [this AI] bu bağlamda anlamlı bir şey yapabilir. Hiç kimse benzer bir şey yapmaya çalışmamıştı [before]”

Anlamı anlamak

4 milyon Wikipedia alıntısından oluşan bir veri kümesi kullanılarak eğitilen Meta’nın yeni aracı, bir alıntıyla bağlantılı bilgileri etkili bir şekilde analiz edebilir ve ardından destekleyici kanıtlarla çapraz referans verebilir. Ve bu sadece basit bir metin dizisi karşılaştırması da değil.

“Böyle bir bileşen var, [looking at] iddia ve kaynak arasındaki sözcüksel benzerlik, ancak bu kolay bir durum” dedi Petroni. “Bu modellerle yaptığımız şey, tüm bu web sayfalarını pasajlara bölerek ve her pasaj için doğru bir temsil sağlayarak bir indeks oluşturmak… Bu pasajı kelime kelime değil, pasajın anlamını temsil ediyor. . Bu, benzer anlamlara sahip iki metin parçasının, tüm bu pasajların depolandığı ortaya çıkan n-boyutlu uzayda çok yakın bir konumda temsil edileceği anlamına gelir.

xkcd'den Wikipedia alıntıları hakkında tek bölmeli bir çizgi roman
xkcd

Ancak, sahte alıntıları tespit etme yeteneği kadar etkileyici olan şey, aracın daha iyi referanslar önerme potansiyelidir. Bir üretim modeli olarak kullanılan bu araç, belirli bir noktayı en iyi şekilde gösterecek referanslar önerebilir. Petroni bunun gerçeğe dayalı bir yazım denetimine benzetilmesine, hataları işaretlemesine ve iyileştirmeler önermesine karşı çıksa da, bu onun ne yapabileceğini düşünmenin kolay bir yolu.

Ancak Petroni’nin açıkladığı gibi, bu noktaya gelmeden önce yapılacak daha çok iş var. “Yaptığımız şey bir konsept kanıtı” dedi. “Şu anda gerçekten kullanılabilir değil. Bunun kullanılabilir olması için, şu anda sahip olduğumuzdan çok daha fazla veriyi endeksleyen yeni bir dizine sahip olmanız gerekir. Her gün yeni bilgiler gelecek şekilde sürekli güncellenmesi gerekiyor.”

Bu, en azından teoride, sadece metni değil, multimedyayı da içerebilir. Belki de YouTube’da mevcut olan ve sistemin kullanıcıları yönlendirebileceği harika bir yetkili belgesel vardır. Belki belirli bir iddianın cevabı, çevrimiçi bir yerde bir görüntüde gizlidir.

bir kalite sorusu

Başka zorluklar da var. En azından şu anda, atıfta bulunulan kaynakların kalitesini bağımsız olarak derecelendirmeye yönelik herhangi bir girişim, yokluğunda dikkate değerdir. Bu başlı başına çetrefilli bir alan. Basit bir örnek olarak, bir konuya kısa bir atıf, diyelim ki, New York Times Daha kapsamlı, ancak daha az bilinen bir kaynaktan daha uygun, yüksek kaliteli bir alıntı mı? Bir ana akım yayın, ana akım olmayan bir yayından daha üst sıralarda yer almalı mı?

Google’ın trilyon dolarlık PageRank algoritması – kesinlikle alıntılar etrafında oluşturulmuş en ünlü algoritma – bunu, özünde yüksek kaliteli bir kaynağı çok sayıda gelen bağlantıya sahip olan bir kaynakla eşitleyerek modeline yerleştirdi. Şu anda, Meta’nın yapay zekasında böyle bir şey yok.

Bu yapay zeka etkili bir araç olarak çalışacaksa, böyle bir şeye sahip olması gerekirdi. Nedenine çok açık bir örnek olarak, bir Wikipedia sayfasına dahil edilmek üzere en korkunç, kınanması gereken görüşün “kanıtlanması” gerektiğini hayal edin. Bir şeyin doğru olduğunu doğrulamak için gereken tek kanıt, benzer duyguların başka bir yerde çevrimiçi olarak yayınlanıp yayınlanmayacağıysa, o zaman neredeyse her iddia teknik olarak doğru olabilir – ne kadar yanlış olursa olsun.

“[One area we are interested in] Petroni, bir kaynağın güvenilirliğini, bir alanın güvenilirliğini açıkça modellemeye çalışıyor” dedi. “Vikipedi’de zaten güvenilir olarak kabul edilen alan adlarının ve olmadığı kabul edilen alanların bir listesi olduğunu düşünüyorum. Ancak sabit bir listeye sahip olmak yerine, bunları algoritmik olarak tanıtmanın bir yolunu bulabilirsek iyi olur.”






genel-19