Yeni bir çevrimiçi araç, kullanıcıların eğitim veri kümelerinin yasal durumunu belirlemesine, izlemesine ve öğrenmesine olanak tanır. üretken yapay zekaHızlı bir bakış, çoğunun lisans sorunları yaşayabileceğini gösteriyor.

Veri Kaynak Gezgini olarak adlandırılan araç, iki şirket arasındaki ortak çabanın sonucudur. makine öğrenme MIT’den hukuk uzmanları, üretken AI API sağlayıcısı Cohere ve diğer 11 kuruluş (Harvard Hukuk Fakültesi, Carnegie Mellon Üniversitesi ve Apple) katkıda bulunanlar arasında yer alıyor. Data Provenance Explorer, araştırmacıların, gazetecilerin ve diğer herkesin binlerce yapay zeka eğitim veritabanında arama yapmasına ve yaygın olarak kullanılan veri kümelerinin “soyunu” izlemesine olanak tanır.

Buradaki fikir, üretken yapay zeka geliştirmek için kullanılan eğitim verilerinin bazen karanlık dünyasını keşfetmenin bir yolunu sağlamaktır. Data Provenance Explorer’ı duyuran resmi bir açıklamada, arkasındaki ekip, üretken yapay zeka sistemlerinin geliştirilmesini ve ticari kullanımını zorlaştırabilecek bir “veri şeffaflığı krizini” tanımladı.

Kitle kaynaklı veri kümelerinin lisansları yok

“GitHub, Papers with Code ve birçok açık kaynaklı LLM gibi kitle kaynaklı toplayıcılar [large language models] Grup, bu toplayıcılara ilişkin verilerden eğitilenlerin %72 ile %83 arasında değişen son derece yüksek bir eksik veri lisansı oranına sahip olduğunu belirtti. “Ayrıca, kitle kaynaklı toplayıcılar tarafından atanan lisanslar sıklıkla veri setinin yazarları tarafından ifade edilen asıl amaçtan daha geniş kullanıma izin veriyor.”

IDC araştırma direktörü Kathy Lange’ye göre, sorumlu bir şekilde geliştirilen yapay zekaya duyulan ihtiyaç, sektörün gayet iyi bildiği bir şey. Üretken yapay zekanın yaygınlaştırılmasına yönelik aceleci çabanın, verilerin güvenli ve yasal kullanımına yönelik kamuoyunda bir odaklanma yarattığını söyledi.

“Verilerin kaynağını anlamak; Lange, bunun nasıl toplandığı, işlendiği ve dönüştürüldüğü, yapay zeka modeli sonuçlarına olan güveni etkileyebilir” dedi. “Veri kaynağına öncelik veren yapay zeka tedarikçileri, şeffaflık, hesap verebilirlik ve uyumluluk girişimlerine ihtiyaç duyan müşteriler için pazarda bir avantaja sahip olacak.”

Yapay zeka verileri bazı açılardan bir savaş alanından başka bir şey değil. Lange, dijital sanatı, eğitim verileri için telif hakkıyla korunan çalışmaları kullanmaya çalışan yapay zeka yaratıcılarının kafasını karıştıracak şekilde ustaca değiştiren Nightshade aracının yakın zamanda tanıtıldığını vurguladı. Dahası, yazarlar ve diğer telif hakkı sahipleri, eserlerinin üretken yapay zeka eğitiminde kullanılmasına karşı yasal işlem başlatmaya başladı; komedyen ve yazar Sarah Silverman, bu nedenle OpenAI’ye dava açanlar arasında yer alıyor. Ancak bu iddialara ilişkin hukuki manzara pek çok açıdan belirsizliğini koruyor.

Telif Hakkı © 2023 IDG Communications, Inc.



genel-13