İçerik lisanslama girişimi TollBit’e göre birçok yapay zeka şirketi, web sitelerinden izinsiz içerik çıkarmak için Robot Hariç Tutma Protokolü’nü (robots.txt) atlatıyor. Reuters. Bu sorun, yapay zeka firmaları ve yayıncılar arasında tartışmalara yol açtı ve Forbes, Perplexity’yi içeriğini intihal etmekle suçladı.
TollBit’in yayıncılara gönderdiği ve Reuters tarafından ele geçirilen mektup, birçok yapay zeka aracısının, bir sitenin bazı bölümlerinin taranmasını engellemek için kullanılan robots.txt standardını göz ardı ettiğini ortaya koyuyor. Şirketin analitiği, çeşitli yapay zekaların izinsiz olarak verileri eğitim amacıyla kullanması nedeniyle yaygın bir uyumsuzluk modelinin ortaya çıktığını gösteriyor. Özellikle yapay zeka arama girişimi Perplexity, Forbes tarafından araştırma hikayelerini yapay zeka tarafından oluşturulan özetlerde uygun bir atıf veya izin olmadan kullanmakla suçlanıyor. Perplexity bu iddialar hakkında yorum yapmadı.
1990’ların ortasında oluşturulan robots.txt protokolü, web tarayıcılarının web sitelerine aşırı yükleme yapmasını önlemeyi amaçlıyordu. Yasal bir yaptırımı olmamasına rağmen, şimdiye kadar geleneksel olarak geniş çapta saygı duyulmuş gibi görünüyor. Yayıncılar bu protokolü, algoritmaları eğitmek ve özetler oluşturmak için içeriği kazıyan yapay zeka sistemleri tarafından izinsiz içerik kullanımını engellemek için kullanır.
Reuters’e göre TollBit şöyle yazdı: “Pratik anlamda bunun anlamı, birden fazla kaynaktan (tek bir şirketten değil) gelen yapay zeka ajanlarının sitelerden içerik almak için robots.txt protokolünü atlamayı tercih etmesidir.” “Ne kadar çok yayıncı günlüğü alırsak, bu model o kadar fazla ortaya çıkar.”
New York Times gibi bazı yayıncılar, telif hakkı ihlali nedeniyle yapay zeka şirketlerine karşı yasal işlem başlattı. Diğerleri ise lisans anlaşmalarını müzakere etmeyi tercih etti. Devam eden bu tartışma, üretken yapay zekayı eğitmek için içerik kullanmanın değeri ve yasallığı konusundaki çelişkili görüşleri vurguluyor; birçok yapay zeka geliştiricisi, ücretli içerik olmadığı sürece içeriğe ücretsiz olarak erişmenin herhangi bir yasayı ihlal etmediğini savunuyor.
Yapay zeka tarafından oluşturulan haber özetleri yaygınlaştıkça bu konu önem kazandı. Arama sorgularına yanıt olarak özetler oluşturan Google’ın yapay zeka ürünü, yayıncıların endişelerini daha da kötüleştirdi. İçeriklerinin Google’ın yapay zekası tarafından kullanılmasını önlemek için yayıncılar, içeriği robots.txt kullanarak engelliyor ancak bu, içeriklerini arama sonuçlarından kaldırıyor ve çevrimiçi görünürlüklerini etkiliyor. Bu arada, eğer yapay zekalar robots.txt dosyasını görmezden geliyorsa içerik sahiplerinin bunu hiçbir etkisi olmayacak şekilde kullanmalarının ne anlamı var? Ve çevrimiçi görünürlüğümü kaybediyor musunuz?
TollBit’in ayrıca bu yapay zeka ve editoryal içerik yarışında kendisini içerik kullanımı için lisans anlaşmaları yapılmasına yardımcı olan yapay zeka şirketleri ve yayıncılar arasında bir aracı olarak konumlandıran bir atı var. Başlangıç, yayıncı web sitelerine giden yapay zeka trafiğini izliyor ve premium içerik de dahil olmak üzere farklı içerik türleri için ücretler üzerinde pazarlık yapmak üzere analizler sağlıyor. TollBit, Mayıs ayı itibarıyla hizmetlerini kullanan 50 web sitesine sahip olduğunu iddia ediyor ancak adlarını açıklamadı.