Google’ın etkileyici yeni AI sistemi, metin açıklaması verilen herhangi bir türde müzik üretebilir. Ancak risklerden korkan şirketin onu piyasaya sürmek için acil bir planı yok.
İsminde MüzikLM, Google’ın kesinlikle şarkı için ilk üretken yapay zeka sistemi değil. Müziği görselleştirerek besteleyen bir yapay zeka olan Riffusion’ın yanı sıra Google’ın kendi AudioML’si ve OpenAI’nin Jukebox’ı olan Dance Diffusion gibi başka girişimler de oldu. Ancak teknik sınırlamalar ve sınırlı eğitim verileri nedeniyle, hiçbiri kompozisyon veya yüksek doğruluk açısından özellikle karmaşık şarkılar üretemedi.
MusicLM belki de bunu yapabilen ilk kişidir.
Ayrıntılı bir akademik kağıtMusicLM, içerik oluşturucuların ifadesiyle “önemli karmaşıklık” (örneğin, “unutulmaz bir saksafon solosu ve bir solo şarkıcı ile büyüleyici caz şarkısı” veya ” Düşük bas ve güçlü tekme ile 90’ların Berlin tekno müziği.” Şarkıları, dikkate değer bir şekilde, yaratıcı veya müzikal olarak tutarlı olmasa da, bir insan sanatçının besteleyebileceği gibi geliyor.
Nasıl olduğunu abartmak zor iyi döngüde müzisyenler veya enstrümantalistler olmadığı göz önüne alındığında, örnekler ses çıkarır. MusicLM, biraz uzun ve dolambaçlı açıklamalarla beslendiğinde bile enstrümantal riffler, melodiler ve ruh halleri gibi nüansları yakalamayı başarır.
Örneğin, aşağıdaki örneğin başlığı, “uzayda kaybolma deneyimini uyandırır” bitini içeriyordu ve kesinlikle bu cephede (en azından benim kulaklarıma göre) veriyor:
İşte “Bir atari oyununun ana müziği” cümlesiyle başlayan bir açıklamadan oluşturulmuş başka bir örnek. Makul, değil mi?
MusicLM’nin yetenekleri şarkılardan kısa klipler oluşturmanın ötesine geçer. Google araştırmacıları, sistemin ister mırıldanılsın, ister söylensin, ıslık çalınsın veya bir enstrümanda çalınsın, mevcut melodiler üzerine inşa edilebileceğini gösteriyor. Ayrıca MusicLM, sırayla yazılan çeşitli tanımları alabilir (ör. “meditasyon zamanı”, “uyanma zamanı”, “koşma zamanı”, “%100 verme zamanı”) ve bir tür melodik “hikaye” veya anlatı yaratabilir. Uzunluğu birkaç dakikaya kadar değişen — bir film müziği için mükemmel şekilde uygundur.
“Bir video oyununda çalınan elektronik şarkı”, “nehrin yanında çalınan meditasyon şarkısı”, “ateş”, “havai fişekler” dizisinden gelen aşağıya bakın.
Hepsi bu değil. MusicLM ayrıca bir resim ve açıklama kombinasyonu yoluyla da öğretilebilir veya belirli bir türdeki belirli bir enstrüman türü tarafından “çalınan” ses üretilebilir. Yapay zeka “müzisyeninin” deneyim düzeyi bile ayarlanabilir ve sistem yerlerden, çağlardan veya gereksinimlerden ilham alan müzikler oluşturabilir (örneğin, antrenmanlar için motivasyon müziği).
Ancak MusicLM kesinlikle kusursuz değildir – gerçekte bundan çok uzaktır. Örneklerden bazıları, eğitim sürecinin kaçınılmaz bir yan etkisi olan çarpık bir kaliteye sahiptir. Ve MusicLM teknik olarak koro armonileri de dahil olmak üzere vokal üretebilse de arzulanan çok şey bırakıyor. “Şarkı sözlerinin” çoğu, birkaç sanatçının karışımı gibi ses çıkaran sentezlenmiş seslerle söylenen, zar zor İngilizce’den saf anlamsız sözlere kadar uzanıyor.
Yine de Google araştırmacıları, eğitim verilerinden alınan telif hakkıyla korunan materyalleri oluşturulan şarkılara dahil etme eğilimi de dahil olmak üzere MusicLM gibi bir sistemin ortaya çıkardığı birçok etik zorluğa dikkat çekiyor. Bir deney sırasında, sistemin ürettiği müziğin yaklaşık %1’inin doğrudan üzerinde eğitim aldığı şarkılardan kopyalandığını buldular – görünüşe göre onları MusicLM’yi mevcut durumunda yayınlamaktan caydıracak kadar yüksek bir eşik.
Makalenin ortak yazarları, “Kullanım durumuyla ilişkili yaratıcı içeriğin potansiyel olarak kötüye kullanılması riskini kabul ediyoruz” diye yazdı. “Müzik üretimiyle ilgili bu risklerin üstesinden gelmek için gelecekte daha fazla çalışma yapılması gerektiğini güçlü bir şekilde vurguluyoruz.”
MusicLM veya buna benzer bir sistemin bir gün kullanıma sunulacağını varsayarsak, sistemler sanatçıların yerini almak yerine sanatçılara yardımcı olacak araçlar olarak konumlandırılsa bile önemli yasal sorunların gündeme gelmesi kaçınılmaz görünüyor. Daha basit AI sistemleri olsa da zaten sahipler. 2020’de Jay-Z’nin plak şirketi, Billy Joel’in “We Didn’t Start the Fire” gibi şarkıların Jay-Z cover’larını oluşturmak için yapay zekayı kullandığı için bir YouTube kanalı olan Vocal Synthesis’e telif hakkı ihtarı verdi. YouTube, videoları ilk başta kaldırdıktan sonra, yayından kaldırma isteklerinin “eksik” olduğunu fark ederek videoları eski durumuna getirdi. Ancak derin sahte müzik hala belirsiz yasal zeminde duruyor.
A Beyaz kağıt Şu anda Music Publishers Association’da yasal bir stajyer olan Eric Sunray tarafından yazılan, MusicLM gibi yapay zeka müzik üreticilerinin “eğitim sırasında aldıkları çalışmalardan tutarlı ses duvar halıları” oluşturarak müzik telif hakkını ihlal ettiğini ve böylece Amerika Birleşik Devletleri Telif Hakkı Yasası’nın çoğaltma hakkını ihlal ettiğini savunuyor. ” Jukebox’ın yayınlanmasının ardından eleştirmenler, AI modellerini telif hakkıyla korunan müzik materyalleri üzerinde eğitmenin adil kullanım teşkil edip etmediğini de sorguladılar. Görüntü, kod ve metin üreten AI sistemlerinde kullanılan ve genellikle içerik oluşturucuların bilgisi olmadan web’den alınan eğitim verileriyle ilgili benzer endişeler dile getirildi.
Bir kullanıcı açısından, Waxy’den Andy Baio spekülasyonlar bir AI sistemi tarafından üretilen müziğin türev bir çalışma olarak kabul edileceği ve bu durumda yalnızca orijinal unsurların telif hakkı ile korunacağı. Elbette, bu tür müziklerde neyin “orijinal” olarak kabul edilebileceği belli değil; bu müziği ticari olarak kullanmak, keşfedilmemiş sulara girmektir. Üretilen müziğin parodi ve yorum gibi adil kullanım kapsamında korunan amaçlar için kullanılması daha basit bir meseledir, ancak Baio mahkemelerin dava bazında kararlar vermesini beklemektedir.
Konuyla ilgili bir netlik olması uzun sürmeyebilir. Mahkemelerde yol alan birkaç davanın, çalışmaları yapay zeka sistemlerini kendi bilgileri veya rızaları olmadan eğitmek için kullanılan sanatçıların haklarıyla ilgili bir tanesi de dahil olmak üzere, müzik üreten yapay zeka ile ilgili olması muhtemeldir. Ama zaman gösterecek.