Alex Reisner, Atlantic muhabiri, AI modellerini eğitmek için kullanılan dört müzik veri setini keşfetti ve bunları halka tamamen erişilebilir hale getirdi. Bu setlerden ikisi, 12 milyon ve 9 milyon parça ile oldukça büyük. Diğer iki set ise daha küçük olmasına rağmen, her biri 100,000’den fazla şarkı ile önemli bir eğitim verisi miktarını temsil ediyor.
Reisner’in aktardığına göre, bu veri setleri binlerce kez indirildi ve kimlerin kullandığı tam olarak bilinemese de, Google ve Stability araştırma makalelerinde bu veri setlerini kullandıklarını onayladı. Örneğin, Free Music Archive veri seti, kişisel kullanım için serbest olsa da, ticari uygulamalar için lisanslama gerektiriyor.
Teoride bu veri setleri internet üzerinden serbestçe erişilebilir olsa da, eğitim verisi olarak kullanmak basit bir ZIP dosyası indirmekten çok daha fazlasını gerektiriyor. Reisner, konuya dair şöyle söylüyor:
Üç tane bulduğum veri seti, şarkıların YouTube veya Spotify’daki bağlantılarının listesi olarak dağıtılıyor. AI geliştiricileri, bu işin otomatikleştirilmesine olanak tanıyan araçlarla, aslında sesi indiriyorlar. Bu araçlar, geliştiricilerin giriş sayfaları, reklamlar ve yaratıcıların para kazanmasını veya abone sayısını artırmasını sağlayan mekanizmaları aşmasına izin veriyor. Bu tür araçlar, bu platformların kullanım şartlarını ihlal ediyor.
Veri setlerinin geniş erişimi, müzik endüstrisinde nitelikli AI uygulamaları geliştirmek için yeni bir dönem açmayı vaat ediyor. Ancak bu tür verilerin etik kullanımı hakkında ne düşünüyorsunuz?

