Meta, Google tarafından geride bırakılmamak üzere kendi yapay zeka destekli müzik oluşturucusunu piyasaya sürdü ve Google’ın aksine bunu açık kaynaklı yaptı.

İsminde MüzikGenDemosu bulunabilen Meta’nın müzik oluşturma aracı Burada, bir metin açıklamasını (örneğin, “Arka planda ağır davullar ve sentezleme pedleri olan bir 80’lerin sürüş pop şarkısı”) yaklaşık 12 saniyelik sesli, verici veya alıcıya dönüştürebilir. MusicGen isteğe bağlı olarak mevcut bir şarkı gibi referans sesle “yönlendirilebilir”, bu durumda hem açıklamayı hem de melodiyi takip etmeye çalışır.

Meta, MusicGen’in 10.000 “yüksek kaliteli” lisanslı müzik parçası ve büyük bir stok medya kitaplığı olan ShutterStock ve Pond5’ten yalnızca enstrüman içeren 390.000 parça dahil olmak üzere 20.000 saatlik müzik üzerinde eğitildiğini söylüyor. Şirket, modeli eğitmek için kullandığı kodu sağlamadı, ancak sahip olmak doğru donanıma sahip herkesin – özellikle yaklaşık 16 GB belleğe sahip bir GPU – çalıştırabileceği önceden eğitilmiş modeller sağladı.

Peki MusicGen nasıl performans gösteriyor? Şey, derdim – kesinlikle insan müzisyenleri işsiz bırakacak kadar iyi olmasa da. Şarkıları makul derecede melodik, en azından “ambient chiptunes music” gibi temel istemler için ve – bana göre – Google’ın AI müzik oluşturucusu MusicLM’nin sonuçlarıyla eşit (biraz daha iyi değilse de). Ama herhangi bir ödül kazanamayacaklar.

İşte “caz asansör müziği” için MusicGen’den çıktı:

Ve işte MusicLM’nin yorumu:


Ardından, MusicGen’i bir döngüye sokmak için daha karmaşık bir komut verdim: “Organik örneklerle Lo-fi yavaş BPM elektro soğutma.” MusicGen, müzikal tutarlılık açısından şaşırtıcı bir şekilde MusicLM’yi gölgede bıraktı ve üzerinde kolayca bir ev bulabilecek bir şey üretti. Lofi Kızı.

İşte MusicGen’in örneği:

Ve işte MusicLM’ler:

İşleri biraz değiştirmek için, George Gershwin tarzında bir piyano ditty oluşturmak için her iki aracı da kullanmayı denedim. “Denedim” diyorum çünkü üretken müzik araçlarıyla ilgili telif hakkı sorunlarını önlemek amacıyla Google, MusicLM’nin genel sürümünde belirli sanatçılardan bahsetmeyi engelleyen bir filtre uyguladı.

MusicGen’de böyle bir filtre yoktur. Ancak “Gershwin tarzında arka plan piyano müziği” sonuçları arzulanan bir şey bıraktı, söylemeliyim:

Üretken müzik açıkça gelişiyor (bkz. Riffusion, Dance Diffusion ve OpenAI’s Jukebox). Ancak önemli etik ve yasal sorunlar henüz çözülmedi. MusicGen gibi AI, benzer efektler üretmek için mevcut müzikten “öğrenir”; bu, tüm sanatçıların – veya üretken AI kullanıcılarının – rahat olmadığı bir gerçektir.

Giderek, ev yapımı parçalar otantik olarak aktarılabilecek veya en azından yeterince yakın olan tanıdık sesleri çağrıştırmak için üretken yapay zekayı kullananlar viral hale geliyor. Müzik şirketleri, fikri mülkiyet endişelerini gerekçe göstererek onları akış ortaklarına işaret etmekte hızlı davrandılar – ve onlar genel olarak galip geldi Ancak “deepfake” müziğin sanatçıların, plak şirketlerinin ve diğer hak sahiplerinin telif haklarını ihlal edip etmediği konusunda hala netlik yok.

Konuyla ilgili rehberlik olması uzun sürmeyebilir. Mahkemelerde yol alan birkaç davanın, çalışmaları yapay zeka sistemlerini kendi bilgileri veya rızaları olmadan eğitmek için kullanılan sanatçıların haklarıyla ilgili bir tanesi de dahil olmak üzere, müzik üreten yapay zeka ile ilgili olması muhtemeldir.

MusicGen’in nasıl kullanılabileceği konusunda herhangi bir kısıtlama getirmeyen Meta, MusicGen’in eğitildiği tüm müziklerin Shutterstock ile yapılan bir anlaşma da dahil olmak üzere “hak sahipleriyle yapılan yasal anlaşmalar kapsamında” olduğunu söylüyor.





genel-24