OpenAI’nin yapay zeka modellerini eğitmek için çalışmalarını izinsiz olarak kazıdığı iddiasıyla dava açan New York Times ve Daily News avukatları, OpenAI mühendislerinin davayla ilgili potansiyel verileri yanlışlıkla sildiğini söylüyor.
Bu sonbaharın başlarında OpenAI, The Times ve Daily News danışmanlarının yapay zeka eğitim setlerinde telif hakkıyla korunan içerikleri aramasını gerçekleştirebilmesi için iki sanal makine sağlamayı kabul etti. (Sanal makineler, başka bir bilgisayarın işletim sisteminde bulunan ve genellikle test etme, verileri yedekleme ve uygulamaları çalıştırma amacıyla kullanılan yazılım tabanlı bilgisayarlardır.) Yayıncıların avukatları, bir mektupta kendilerinin ve işe aldıkları uzmanların, 1 Kasım’dan bu yana OpenAI’nin eğitim verileri aranırken 150 saatten fazla süre geçti.
Ancak Çarşamba günü geç saatlerde ABD New York Güney Bölgesi Bölge Mahkemesine sunulan yukarıda belirtilen mektuba göre, OpenAI mühendisleri 14 Kasım’da yayıncıların sanal makinelerden birinde depolanan tüm arama verilerini sildi.
OpenAI verileri kurtarmaya çalıştı ve çoğunlukla başarılı oldu. Ancak klasör yapısı ve dosya adları “geri getirilemeyecek şekilde” kaybolduğu için, kurtarılan veriler “haber davacılarının kopyalanan makalelerinin nerede kullanıldığını belirlemek için kullanılamaz” [OpenAI’s] modeller” mektuba göre.
The Times ve Daily News’in avukatı, “Haber davacıları, önemli miktarda insan saati ve bilgisayar işlem süresi kullanarak çalışmalarını sıfırdan yeniden oluşturmak zorunda kaldılar” diye yazdı. “Haber davacıları, kurtarılan verilerin kullanılamaz olduğunu ve uzmanların ve avukatların bir haftalık çalışmasının yeniden yapılması gerektiğini daha dün öğrendi; bu ek mektubun bugün sunulmasının nedeni de budur.”
Davacıların avukatı, silme işleminin kasıtlı olduğuna inanmak için hiçbir nedenleri olmadığını açıkça ortaya koyuyor. Ancak olayın, OpenAI’nin kendi araçlarını kullanarak potansiyel olarak hak ihlalinde bulunan içerikleri aramak için “kendi veri kümelerini aramak için en iyi konumda” olduğunun altını çizdiğini söylüyorlar.
OpenAI sözcüsü bir açıklama yapmayı reddetti.
Bu ve diğer durumlarda OpenAI, The Times ve Daily News’teki makaleler de dahil olmak üzere kamuya açık verileri kullanan eğitim modellerinin adil kullanım olduğunu savundu. Başka bir deyişle, insana benzeyen metinler oluşturmak için milyarlarca e-kitap, makale ve daha fazla örnekten “öğrenen” GPT-4o gibi modeller oluştururken OpenAI, lisans almanın veya bunun için başka bir şekilde ödeme yapmanın gerekli olmadığına inanıyor. örnekler – bu modellerden para kazansa bile.
Bununla birlikte OpenAI, Associated Press, Business Insider’ın sahibi Axel Springer, Financial Times, People’ın ana şirketi Dotdash Meredith ve News Corp dahil olmak üzere giderek artan sayıda yeni yayıncıyla lisans anlaşmaları imzaladı. OpenAI bunların şartlarını yapmayı reddetti halka açık anlaşmalar yapıyor ancak bir içerik ortağı olan Dotdash bildirildiğine göre Yılda en az 16 milyon dolar ödeniyor.
OpenAI, AI sistemlerini herhangi bir telif hakkıyla korunan eser üzerinde izinsiz olarak eğittiğini ne doğruladı ne de reddetti.