OpenAI’nin yapay zeka modellerini eğitmek için çalışmalarını izinsiz olarak kazıdığı iddiasıyla dava açan New York Times ve Daily News avukatları, OpenAI mühendislerinin davayla ilgili potansiyel verileri yanlışlıkla sildiğini söylüyor.
Bu sonbaharın başlarında OpenAI, The Times ve Daily News danışmanlarının yapay zeka eğitim setlerinde telif hakkıyla korunan içerikleri aramasını gerçekleştirebilmesi için iki sanal makine sağlamayı kabul etti. (Sanal makineler, başka bir bilgisayarın işletim sisteminde bulunan ve genellikle test etme, verileri yedekleme ve uygulamaları çalıştırma amacıyla kullanılan yazılım tabanlı bilgisayarlardır.) mektupYayıncıların avukatları, kendilerinin ve işe aldıkları uzmanların 1 Kasım’dan bu yana OpenAI’nin eğitim verilerini aramak için 150 saatten fazla zaman harcadıklarını söylüyor.
Ancak Çarşamba günü geç saatlerde ABD New York Güney Bölgesi Bölge Mahkemesine sunulan yukarıda belirtilen mektuba göre, OpenAI mühendisleri 14 Kasım’da yayıncıların sanal makinelerden birinde depolanan tüm arama verilerini sildi.
OpenAI verileri kurtarmaya çalıştı ve çoğunlukla başarılı oldu. Ancak klasör yapısı ve dosya adları “geri getirilemeyecek şekilde” kaybolduğu için, kurtarılan veriler “haber davacılarının kopyalanan makalelerinin nerede kullanıldığını belirlemek için kullanılamaz” [OpenAI’s] modeller” mektuba göre.
The Times ve Daily News’in avukatı, “Haber davacıları, önemli miktarda insan saati ve bilgisayar işlem süresi kullanarak çalışmalarını sıfırdan yeniden oluşturmak zorunda kaldılar” diye yazdı. “Haber davacıları, kurtarılan verilerin kullanılamaz olduğunu ve uzmanların ve avukatların bir haftalık çalışmasının yeniden yapılması gerektiğini daha dün öğrendi; bu ek mektubun bugün sunulmasının nedeni de budur.”
Davacıların avukatı, silme işleminin kasıtlı olduğuna inanmak için hiçbir nedenleri olmadığını açıkça ortaya koyuyor. Ancak olayın, OpenAI’nin kendi araçlarını kullanarak potansiyel olarak hak ihlalinde bulunan içerikleri aramak için “kendi veri kümelerini aramak için en iyi konumda” olduğunun altını çizdiğini söylüyorlar.
OpenAI sözcüsü bir açıklama yapmayı reddetti.
Ancak 22 Kasım Cuma günü geç saatlerde OpenAI danışmanı bir başvuruda bulundu. cevap Avukatların Çarşamba günü The Times ve Daily News için gönderdiği mektuba. Yanıtlarında OpenAI’nin avukatları, OpenAI’nin herhangi bir kanıtı sildiğini kesin olarak reddetti ve bunun yerine davacıların teknik bir soruna yol açan sistem yanlış yapılandırmasından sorumlu olduğunu öne sürdü.
OpenAI’nin avukatı, “Davacılar, OpenAI’nin eğitim veri kümelerini aramak için sağladığı birkaç makineden birinde konfigürasyon değişikliği talep etti” diye yazdı. “Ancak davacıların talep ettiği değişikliğin uygulanması, geçici bir önbellek olarak kullanılması gereken bir sabit sürücüdeki klasör yapısının ve bazı dosya adlarının kaldırılmasıyla sonuçlandı… Her halükarda, herhangi bir dosyanın silineceğini düşünmek için hiçbir neden yok. aslında kaybolmuştu.”
Bu ve diğer durumlarda OpenAI, The Times ve Daily News’teki makaleler de dahil olmak üzere kamuya açık verileri kullanan eğitim modellerinin adil kullanım olduğunu savundu. Başka bir deyişle, insana benzeyen metinler oluşturmak için milyarlarca e-kitap, makale ve daha fazla örnekten “öğrenen” GPT-4o gibi modeller oluştururken OpenAI, lisans almanın veya bunun için başka bir şekilde ödeme yapmanın gerekli olmadığına inanıyor. örnekler – bu modellerden para kazansa bile.
Bununla birlikte OpenAI, Associated Press, Business Insider’ın sahibi Axel Springer, Financial Times, People’ın ana şirketi Dotdash Meredith ve News Corp dahil olmak üzere giderek artan sayıda yeni yayıncıyla lisans anlaşmaları imzaladı. OpenAI bunların şartlarını yapmayı reddetti halka açık anlaşmalar yapıyor ancak bir içerik ortağı olan Dotdash bildirildiğine göre Yılda en az 16 milyon dolar ödeniyor.
OpenAI, AI sistemlerini herhangi bir telif hakkıyla korunan eser üzerinde izinsiz olarak eğittiğini ne doğruladı ne de reddetti.
Güncelleme: OpenAI’nin iddialara yanıtı eklendi.

