Ortalama olarak yayınladığım her hikaye yaklaşık 20 kez çalınıyor. Örneğin, çok sayıda soygun sitesi, tatilde işten çıkarmalarla ilgili son yazımı aynı gün içinde bir düzineden fazla kopyalayıp yapıştırdı. Neden? Çünkü okuyucuların görüşlerini bana bir kuruş bile ödemeden alıyorlar.
Elbette, otomatik içerik kazıma siteleri fazla para kazandırmıyor, ancak spam gibi bu sürecin de onlara maliyeti çok yüksek değil. Öte yandan OpenAI, 2023’te 1,3 milyar dolar gelir elde ettive bana bir kuruş bile ödemediler.
Görüyorsunuz, kendini savunmada New York Times‘ OpenAI telif hakkı davası, OpenAI şunu iddia ediyor “Halka açık internet materyallerini kullanarak AI modellerini eğitmek adil kullanımdır.” Evet. Doğru. Bunu daha önce çok ender durumlarda bir içerik kazıyıcının avukatımın onları durdurma girişimlerine yanıt verdiğini duymuştum.
Zamanlar milyonlarca makalesinin artık sohbet robotlarını eğitmek için kullanıldığını savunuyor onunla rekabet eden. Yanlış değil. OpenAI ve diğer üretken AI (genAI) şirketleri, büyük dil modellerini (LLM) aşağıdakileri kullanarak eğitiyorlar: New York Times hikayeler. Gazetenin yazarlarının ve editörlerinin çalışmalarından, para ödemeden milyarlar kazanıyorlar.
OpenAI ayrıca Times’ın hikayelerinin ChatGPT’nin LLM’sinde kullanılmasına izin vermeyeceğini ve gerçekten de vazgeçebileceğini iddia ediyor. Ama eğer durum böyleyse, o zaman nasıl oldu? ChatGPT bu tür makaleleri açıkça intihal ediyor New York City’nin taksi endüstrisindeki yağmacı kredilendirme uygulamalarına ilişkin Pulitzer ödüllü, beş bölümlük 18 aylık bir araştırma olarak mı?
OpenAI bunu yapmanın yollarından birinin ezberleme olduğunu kabul ediyor. “Bu, üzerinde sürekli olarak ilerleme kaydettiğimiz, öğrenme sürecinin nadir görülen bir başarısızlığıdır, ancak belirli bir içeriğin eğitim verilerinde birden fazla kez görünmesi, örneğin parçalarının pek çok farklı halka açık web sitesinde görünmesi gibi daha yaygın bir durumdur.”
Örneğin, yukarıda bahsedilen, hikayeleri kopyalayıp yapıştıran korsan siteler gibi. Gerçekten de OpenAI, taksi serisi soygununun “yıllardır çoğalan eski makalelerden ortaya çıkmış gibi göründüğünü” kabul ediyor çoklu üçüncü–Parti web siteleri“
Ben buna “İlk savunmayı yaptılar” diyorum. Etkilenmedim.
Aynı zamanda OpenAI, Times’ın “mevcut modellerimizin eğitimine anlamlı bir katkıda bulunmadığını ve gelecekteki eğitimler için de yeterince etkili olmayacağını” iddia ediyor. Lütfen.GPT-3’teki en yüksek ağırlıklı veri kümesi, Ortak Taramailk üç veri kaynağı Wikipedia, ABD patent veritabanı ve… New York Times’tır.
Victor Tangermann rolünde Fütürizm.com kadrolu yazar, yakın zamanda şunu yazdı: “OpenAI’nin tüm iş modeli mümkün olduğunca fazla veriyi süpürmeye dayanıyor bulabildiği kadarıyla sıklıkla telif hakkıyla korunan materyal dahil.”
Onun fikrini satın almıyor musun? OpenAI’nin Birleşik Krallık Parlamentosu’na sunduğu argümanlara ne dersiniz? Orada şirket şunları söyledi: “Günümüzde telif hakkı blog gönderileri, fotoğraflar, forum gönderileri, yazılım kodu kırıntıları ve hükümet belgeleri de dahil olmak üzere neredeyse her türlü insan ifadesini kapsadığından, Günümüzün önde gelen yapay zeka modellerini telif hakkıyla korunan materyaller kullanılmadan eğitmek imkansızdır.“
Artık OpenAI’nin telif hakkıyla korunan materyalleri kullanmasına hiçbir itirazım yok. Hiç yok. Ben Times değilim ama önde gelen teknoloji yayınlarında 10.000’den fazla makalem var. Çalışmamın OpenAI tarafından kullanıldığından şüphem yok. OpenAI’yi kullanmaktan memnuniyet duyarız. \
Sadece. Ödemek. Ben.
Merhum bilimkurgu yazarı Harlan Ellison’ın meşhur rantından alıntı yapacak olursak: Yazara ödeme yapın“Her şeyi bir hiç uğruna istiyorlar. Para almadan beş saniye bile durmuyorlar. Ve ne kadar maaş aldıkları konusunda şikayet edip daha fazlasını istiyorlar. Warner Brothers’a bedava bir şeyler mi yapmalıyım?! Ne yani? Warner Brothers göz bandı ve teneke bardakla sokakta mı kaldı? Kahretsin, hayır. Onlar her zaman yazarın bir hiç uğruna çalışmasını isterler.”
Aynı şey OpenAI ve diğer genAI şirketleri için de geçerlidir. Yayıncılık şirketleri, yayınevleri, yazarlar ve editörler bu işi yapıyor ve onlar, kimsenin bir kuruş bile ödemeden kâr etmek istiyorlar.
Bu yoldan daha önce de geçmiştik. 1990’lı yıllarda gazete ve dergiler internette yayın yaparak kâr elde edemedikleri için uzun bir düşüşe geçtiler. Bu nedenle içeriğimizi reklam yoluyla kazanca dönüştürmeyi başaran Google, haber yayınları boşa gitmeye devam ederken milyarlarca dolar kazandı.
Yayıncıların bu hatayı tekrar yaptığını göremiyorum. Bu sefer paramızı alacağız. Ve eğer Microsoft ve OpenAI umdukları kadar milyarlar kazanamazlarsa onlar için ağlamayacağım.
Elbette başarısız olabiliriz. Eğer bu gerçekleşirse, aslında geleceğin neye benzeyeceğini görebiliriz. Blog yazarı ve bilim kurgu yazarı Cory Doctorow, bunun için keskin bir kelime olan “Enshittification”ı icat etti. Bununla çevrimiçi sitelerin ve bilgilerin kalitesinin düşmesini kastediyor.
Bu sadece bir fikir değil. Son araştırmalar gösteriyor ki”Google’ın arama sonuçları giderek daha az kullanışlı hale geliyor ve daha fazla spam web sitesiyle doluyor.” Giderek daha fazla içerik, arama motoru optimizasyonuna ve yapay zeka tarafından oluşturulan saçmalıklara dayanıyor. Aynı zamanda nicelik yerine kalitedeki düşüş, yayınlar ve yazarlar için daha az gelirle sonuçlanıyor. Bu da, değerli hikayelerin daha da az olacağı anlamına geliyor. genAI motorlarının öğrenebileceği her yer.
OpenAI ve benzerleri akıllıysa, zenginliği içerik yaratıcılarıyla paylaşmaya başlayacaklardır. İster teknoloji milyarderi ister serbest yazar olalım, hepimiz için uzun vadede ilerlemenin tek yolu bu.
Telif Hakkı © 2024 IDG Communications, Inc.