OpenAI’nin yapay zeka modellerini eğitmek için veriler konusunda The New York Times ile olan hukuki savaşı hala devam ediyor olabilir. Ancak OpenAI, Fransa’nın ve İspanya’nın en büyük haber yayıncılarından bazıları da dahil olmak üzere diğer yayıncılarla anlaşmalar yapmaya devam ediyor.

Çarşamba günü OpenAI duyuruldu OpenAI’nin ChatGPT chatbot’una Fransızca ve İspanyolca haber içeriği getirmek için Le Monde ve Prisa Media ile sözleşme imzaladığını söyledi. Bir blog yazısında OpenAI, ortaklığın El País, Cinco Días, As ve El Huffpost gibi markaların sunduğu güncel etkinlik kapsamını anlamlı olduğu yerde ChatGPT kullanıcılarının önüne koyacağını ve OpenAI’nin bugüne kadarki gelişimine katkıda bulunacağını söyledi. -Eğitim verilerinin hacminin genişletilmesi.

OpenAI şunu yazıyor:

Önümüzdeki aylarda, ChatGPT kullanıcıları, orijinal makalelere atıflar ve gelişmiş bağlantılar içeren seçilmiş özetler aracılığıyla bu yayıncıların ilgili haber içerikleriyle etkileşime girebilecek ve kullanıcılara haber sitelerinden ek bilgilere veya ilgili makalelere erişme olanağı verecek. ChatGPT’de sürekli olarak iyileştirmeler yapıyoruz ve haber endüstrisinin kullanıcılara gerçek zamanlı, güvenilir bilgiler sunmadaki temel rolünü destekliyoruz.

Dolayısıyla OpenAI’nin bu noktada bir avuç içerik sağlayıcıyla lisans anlaşması yaptığı ortaya çıktı. Şimdi durumu değerlendirmek için iyi bir fırsat gibi hissettim:

  • Stok medya kütüphanesi Shutterstock (resimler, videolar ve müzik eğitimi verileri için)
  • Associated Press
  • Axel Springer (diğerlerinin yanı sıra Politico ve Business Insider’ın sahibi)
  • Le Monde
  • Prisa Medya

OpenAI her birine ne kadar ödüyor? En azından kamuya açık bir şekilde söylemiyor. Ama tahmin edebiliriz.

Bilgi rapor edildi Ocak ayında OpenAI, yayıncılara GenAI modellerini eğitmek için arşivlere erişmeleri için yılda 1 milyon ila 5 milyon dolar teklif ediyordu. Bu bize Shutterstock ortaklığı hakkında pek bir şey söylemiyor. Ancak makale lisanslama cephesinde – The Information’ın raporunun doğru olduğunu ve bu rakamların o zamandan beri değişmediğini varsayarsak – OpenAI’nin haberler için yılda 4 ila 20 milyon dolar arasında para harcadığı görülüyor.

Bu, savaş sandığı 11 milyar doların üzerinde olan ve yıllık geliri yakın zamanda 2 milyar doları aşan OpenAI için bir kuruş olabilir (başına Financial Times). Ancak Homebrew’un ortağı ve Screendoor’un kurucu ortağı Hunter Walk’un yakın zamanda belirttiği gibi, bu, lisans anlaşmaları peşinde koşan yapay zeka rakiplerini potansiyel olarak geride bırakacak kadar önemli.

Yürümek yazıyor kendi blogunda:

[I]Deneysellik dokuz rakamlı lisans anlaşmalarıyla sınırlanmışsa, yeniliğe zarar vermiş oluyoruz… Eğitim verilerinin ‘sahiplerine’ kesilen çekler, rakipler için girişte büyük bir engel oluşturuyor. Google, OpenAI ve diğer büyük teknoloji şirketleri yeterince yüksek bir maliyet oluşturabilirlerse gelecekteki rekabeti dolaylı olarak önlemiş olurlar.

Bugün girişte bir engel olup olmadığı tartışmalıdır. Çoğu olmasa da birçok yapay zeka sağlayıcısı, yapay zeka modellerini eğittikleri verileri lisanslamamayı tercih ederek, fikri mülkiyet sahiplerinin gazabına uğrama riskini göze almayı seçti. Örneğin sanat üreten Midjourney platformunun eğitim Disney film fotoğraflarında – ve Midjourney’in Disney ile hiçbir anlaşması yok.

Mücadele edilmesi gereken daha zor soru şudur: Lisanslama, yapay zeka alanında iş yapmanın ve deney yapmanın maliyeti midir?

Walk’un bunu söylemediği iddia ediliyor. Belirli şeffaflık ve etik standartlara uydukları sürece, herhangi bir yapay zeka satıcısının yanı sıra küçük ölçekli girişimler ve araştırmacıları yasal sorumluluktan koruyacak, düzenleyici tarafından empoze edilen bir “güvenli liman”ı savunuyor.

İlginç bir şekilde, İngiltere yakın zamanda sınanmış bu doğrultuda bir şeyi kodlamak, araştırma amaçlı olduğu sürece yapay zeka eğitimi için metin ve veri madenciliği kullanımını telif hakkı hususlarından muaf tutmak. Ancak bu çabalar sonuçsuz kaldı.

Yapay zekanın zaten istikrarsızlaşmış bir haber endüstrisi üzerinde yarattığı tehdit göz önüne alındığında, Walk’un “güvenli liman” teklifinde Walk kadar ileri gidebileceğimden emin değilim. The Atlantic’in yeni bir modeli kurmak Google gibi bir arama motoru yapay zekayı aramaya entegre ederse, web sitesine tıklamaya gerek kalmadan kullanıcının sorgusunu %75 oranında yanıtlayabilir.

Ama belki orada dır-dir oymalar için oda.

Yayıncılara ödeme yapılmalı ve adil bir şekilde ödeme yapılmalıdır. Bununla birlikte, onlara ödeme yapıldığı ve AI görevlilerine ve akademisyenlere meydan okuyanların aynı verilere eriştiği bir sonuç yok mu? bunlar gibi görevdekiler? Öyle düşünmeliyim. Hibeler tek yönlüdür. Daha büyük VC kontrolleri başka bir şeydir.

Özellikle mahkemelerin, adil kullanımın yapay zeka satıcılarını telif hakkı taleplerinden koruyup korumayacağına ve ne ölçüde koruyacağına henüz karar vermediği göz önüne alındığında, bir çözüme sahip olduğumu söyleyemem. Ama bunları açığa çıkarmamız hayati önem taşıyor. Aksi takdirde sektör, akademik ‘beyin göçünün’ hız kesmeden devam ettiği ve yalnızca birkaç güçlü şirketin değerli eğitim setlerinden oluşan geniş havuzlara erişebildiği bir durumla karşı karşıya kalabilir.



genel-24