Microsoft, belirli eğitim örneklerinin metin, görüntüler ve üretken AI modellerinin yarattığı diğer medya türleri üzerindeki etkisini tahmin etmek için bir araştırma projesi başlatıyor.
Bu İş listesine göre LinkedIn’de son zamanlarda devridaim olan Aralık ayına kadar uzanıyordu.
Bir araştırma stajyeri arayan listeye göre, proje, modellerin belirli verilerin – örneğin fotoğraf ve kitapların – çıktıları üzerindeki etkisinin “verimli ve faydalı bir şekilde tahmin edilebilecek” şekilde eğitilebileceğini göstermeye çalışacaktır.
“Mevcut sinir ağı mimarileri, nesilleri için kaynak sağlama açısından opaktır ve […] Bunu değiştirmek için iyi nedenler, ”diye okuyor.[One is,] Geleceğin bizi temelde şaşırtacağını varsayarak, gelecekte isteyeceğimiz öngörülemeyen modellere belirli değerli verilere katkıda bulunan kişiler için teşvikler, tanıma ve potansiyel olarak ödeme. ”
AI ile çalışan metin, kod, resim, video ve şarkı jeneratörleri merkezdedir. bir dizi IP davası AI şirketlerine karşı. Sık sık, bu şirketler modellerini, bazıları telif hakkıyla korunan halka açık web sitelerinden büyük miktarlarda veri üzerinde eğitmektedir. Şirketlerin çoğu bunu savunuyor Adil Kullanım Doktrini Veri tarama ve eğitim uygulamalarını korur. Ancak reklamlar – sanatçılardan programcılara, yazarlara kadar – büyük ölçüde katılmıyorum.
Microsoft’un kendisi telif hakkı sahiplerinden en az iki yasal zorlukla karşı karşıya.
New York Times, Aralık ayında teknoloji devini ve bir ara işbirlikçisi Openai’ye dava açtı ve iki şirketi milyonlarca makalesi üzerinde eğitilmiş modeller dağıtarak Times’ın telif hakkını ihlal etmekle suçladı. Birkaç yazılım geliştiricisi Firmanın GitHub Copilot AI kodlama asistanının korunan çalışmalarını kullanılarak yasa dışı eğitildiğini iddia ederek Microsoft’a karşı dava açtı.
Microsoft’un listenin “eğitim zamanı provenansı” olarak tanımladığı yeni araştırma çabası bildirilmiş Jaron Lanier’in katılımı var, Başarılı teknoloji uzmanı ve disiplinlerarası bilim adamı Microsoft Research’te. Nisan 2023’te New Yorker’da op-edLanier, “dijital şeyleri” “bunu yaptıkları için bilinmek isteyen insanlar” ile bağlamak anlamına gelen “veri haysiyeti” kavramı hakkında yazdı.
Lanier, “Büyük bir model değerli bir çıktı sağladığında bir veri-ünlü yaklaşımı en benzersiz ve etkili katkıda bulunanları izleyecektir” diye yazdı. “Örneğin, bir macerada konuşan kedilerin yağ boyama dünyasında çocuklarımın animasyonlu bir filmi isterseniz, o zaman bazı önemli petrol ressamları, kedi portreleri, ses aktörleri ve yazarları-ya da mülkleri-yeni başyapı yaratması için benzersiz bir şekilde gerekli olabilirler.
Hiçbir şey için değil, zaten bunu yapan birkaç şirket var. Yakın zamanda 40 milyon dolarlık risk sermayesi toplayan AI model geliştiricisi Bria, “programlı olarak” veri sahiplerini “genel etkileri” na göre telafi ettiğini iddia ediyor. Adobe ve Shutterstock ayrıca veri kümesi katkıda bulunanlara düzenli ödeme yapar, ancak kesin ödeme tutarları opak olma eğilimindedir.
Birkaç büyük laboratuvar, yayıncılar, platformlar ve veri brokerleriyle mürekkep lisanslama anlaşmaları dışında bireysel katkıda bulunan ödeme programları oluşturmuştur. Bunun yerine, telif hakkı sahiplerinin eğitimi “devre dışı bırakmaları” için araçlar sağladılar. Ancak bu devre dışı bırakma işlemlerinin bazıları zahmetlidir ve sadece gelecekteki modeller için geçerlidir-daha önce eğitilmiş olmayanlar.
Tabii ki, Microsoft’un projesi bir kavram kanıtından biraz daha fazlası olabilir. Bunun için emsal var. Mayıs ayında Openai, içerik oluşturucuların çalışmalarının eğitim verilerine nasıl dahil edilmesini istediklerini veya hariç tutulmasını istediklerini belirtecek benzer bir teknoloji geliştirdiğini söyledi. Ancak neredeyse bir yıl sonra, araç günün ışığını henüz görmedi ve genellikle dahili olarak bir öncelik olarak görülmedi.
Microsoft ayrıca “Etik yıkama“Burada – ya da AI işinde yıkıcı düzenleyici ve/veya mahkeme kararlarından yararlanın.
Ancak şirketin, eğitim verilerini izlemenin yollarını araştırması, diğer AI laboratuvarlarının yakın zamanda ifade edilen adil kullanım konusundaki duruşları ışığında dikkat çekicidir. Google ve Openai de dahil olmak üzere en iyi laboratuvarlardan bazıları, Trump yönetiminin yapay zeka geliştirme ile ilgili olarak telif hakkı korumalarını zayıflatmasını öneren politika belgeleri yayınlamıştır. Openai, ABD hükümetini, geliştiricileri külfetli kısıtlamalardan kurtaracağını iddia ettiği model eğitimi için adil kullanımı kodlamaya çağırdı.
Microsoft, yorum talebine hemen yanıt vermedi.

