Bir YouTube içerik üreticisi, OpenAI’nin milyonlarca YouTube videosundan alınan transkript üzerinde üretken yapay zeka modellerini eğittiğini ve bu sırada videoların sahiplerine herhangi bir bildirimde bulunmadığını veya tazminat ödemediğini iddia ederek şirkete karşı toplu dava açmaya hazırlanıyor.

İçinde şikayet Cuma günü Kaliforniya Kuzey Bölgesi ABD Bölge Mahkemesi’nde açılan davada, Massachusetts’te yaşayan bir YouTube kullanıcısı olan David Millette’in avukatları, OpenAI’nin şirketin yapay zeka destekli sohbet robotu platformu ChatGPT ve diğer üretken yapay zeka araçları ve ürünlerini çalıştıran modelleri eğitmek için Millette’in ve diğer içerik oluşturucuların videolarını gizlice kopyaladığını iddia ediyor. Şikayette, OpenAI’nin bu verileri toplayarak içerik oluşturucuların çalışmalarından “önemli ölçüde kar elde ettiği” ve telif hakkı yasasını ve YouTube’un hizmetinden bağımsız uygulamalar için video kullanımını yasaklayan hizmet şartlarını ihlal ettiği iddia ediliyor.

“Gibi [OpenAI’s] Yapay zeka ürünleri, eğitim veri kümelerinin kullanımıyla daha da karmaşık hale geliyor, erişim için abonelik satın alan potansiyel ve mevcut kullanıcılar için daha değerli hale geliyorlar. [OpenAI’s] “AI ürünleri” diye yazıyor şikayette. “Ancak OpenAI’nin eğitim veri kümelerindeki materyalin çoğu, OpenAI tarafından izin alınmadan, kredi verilmeden ve tazminat ödenmeden kopyalanan çalışmalardan geliyor.”

Hukuk firması Bursor & Fisher tarafından temsil edilen Millette, OpenAI’nin eğitiminde verileri ele geçirilmiş olabilecek tüm YouTube kullanıcıları ve içerik oluşturucuları için jürili yargılama ve 5 milyon doların üzerinde tazminat talep ediyor.

OpenAI gibi üretken AI modelleri gerçek bir zekaya sahip değildir. Çok sayıda örnekle (örneğin, filmler, ses kayıtları, denemeler) beslenen modeller, çevreleyen herhangi bir verinin bağlamı da dahil olmak üzere, desenlere dayanarak verinin oluşma olasılığını “öğrenir”.

Çoğu model, web’deki genel web sitelerinden ve veri kümelerinden alınan verilerle eğitilir. Şirketler, adil kullanımın, verileri ayrım gözetmeksizin toplama ve ticari modelleri eğitmek için kullanma çabalarını koruduğunu savunur. Ancak birçok telif hakkı sahibi buna katılmaz ve uygulamayı durdurmayı amaçlayan davalar açarlar.

Diğer veri kaynakları kurudukça, video transkripsiyonları önemli bir eğitim verisi bileşeni haline geldi.

Dünyanın en iyi 1.000 web sitesinin %35’inden fazlası artık OpenAI’nin web tarayıcısını engelleOriginality.AI’dan alınan verilere göre, “yüksek kaliteli” kaynaklardan gelen verilerin yaklaşık %25’i, AI modellerini eğitmek için kullanılan büyük veri kümelerinden kısıtlanmıştır. çalışmak MIT’nin Veri Kaynağı Girişimi tarafından bulundu. Mevcut erişim engelleme eğilimi devam ederse, araştırma grubu Epoch AI tahmin eder Geliştiricilerin 2026-2032 yılları arasında üretken yapay zeka modellerini eğitmek için ihtiyaç duyacakları verilerin tükeneceği öngörülüyor.

Nisan ayında, New York Times bildirildi OpenAI’nin, ek eğitim verileri toplamak için videolardan ses kaydı yapmak amacıyla ilk konuşma tanıma modeli olan Whisper’ı yarattığını söyledi. Şirketin başkanı Greg Brockman’ın da dahil olduğu bir OpenAI ekibi, The Times’a göre Whisper’ı kullanarak YouTube’dan bir milyondan fazla saatlik videoyu yazıya döktü ve bu yazıları OpenAI’nin metin üreten ve metin analiz eden modeli GPT-4’ü eğitmek için kullandı.

Times’a göre bazı OpenAI çalışanları böyle bir hareketin YouTube kurallarına aykırı olabileceğini tartışıyor.

Temmuz ayında Proof News bildirildi Anthropic, Apple, Salesforce ve Nvidia gibi şirketlerin, yüz binlerce YouTube videosundan altyazılar içeren The Pile adlı bir veri kümesini, üretken AI modellerini eğitmek için kullandığını söyledi. Altyazıları The Pile’da toplanan birçok YouTube içerik üreticisi bundan haberdar değildi ve buna izin vermedi; Apple daha sonra, ürünlerindeki herhangi bir AI özelliğini desteklemek için bu modelleri kullanmayı amaçlamadığını belirten bir açıklama yayınladı.

YouTube’un ana şirketi Google da modellerini eğitmek için transkriptleri kullanmaya çalıştı.

Geçen sene, Google, hizmet şartlarını (ToS) genişletti kısmen şirketin üretken AI modeli eğitimi için daha fazla kullanıcı verisine erişebilmesini sağlamak için. Eski ToS kapsamında, Google’ın video platformunun ötesinde ürünler oluşturmak için YouTube verilerini kullanıp kullanamayacağı açık değildi. Dizginleri önemli ölçüde gevşeten yeni şartlar kapsamında durum böyle değil.

Toplu dava hakkında yorum almak için OpenAI ve Google ile iletişime geçtik ve yanıt almaları halinde bu yazıyı güncelleyeceğiz.

OpenAI için ay zor bir başlangıç ​​oldu.

Tesla ve X CEO’su Elon Musk Pazartesi günü OpenAI’ye karşı yeni bir dava açtı ve CEO Sam Altman, şirketin en gelişmiş teknolojilerinden bazılarını ticari müşteriler için saklayarak orijinal kar amacı gütmeyen misyonunu terk ettiğini iddia ediyor. Musk, Şubat ayında OpenAI’ye karşı açtığı davada aynı iddiaları dile getirdi, ancak yeni davada OpenAI’nin aynı zamanda haraççılık faaliyetlerinde bulunduğu iddia ediliyor.



genel-24