Google'ın metinden müziğe yapay zekası 'MusicLM' aracı artık halka açık

Ocak ayında, Google ilan edildi MüzikLMmetin girişlerinden müzik parçaları oluşturabilen deneysel bir yapay zeka aracı – ChatGPT ve ozan DALL-E’nin bilgi istemlerinden görüntüler oluşturmasının yanı sıra bir metin komutunu bir hikayeye dönüştürebilir. Şirket şimdi aracın denenmeye hazır olduğunu söyledi.

Şirket, MusicLM aracının hangi ülkelerde mevcut olduğundan bahsetmedi. The Times of India-Gadgets Now ekip üyeleri kontrol ettiğinde, AI Test Kitchen’da denemek için bekleme listesine kaydolabildik. Web, Android ve iPhone’larda test için hazır olacak.

Ayrıca Oku

PaLM 2 Google'ın en yeni AI dil modelinin ne olduğu açıklandı

MusicLM nasıl çalışır?
AI programı, metin girişini saniyeler ve hatta dakikalar süren müziğe dönüştürebilir. Kullanıcıların “bir parti için hareketli müzik” gibi bir istem yazması yeterlidir ve MusicLM bir şarkının iki versiyonunu oluşturur. Kullanıcılar her iki versiyonu da dinleyebilir ve “daha çok sevdiğiniz parçaya bir ödül verebilir”, bu da modeli geliştirmeye yardımcı olacaktır.

Şirket ayrıca erken geri bildirim toplamak için Dan Deacon gibi müzisyenlerle çalıştığını söyledi.

MusicLM araştırması ve modları
Github’da yayınlanan bir araştırmada şirket, modeli kullanarak ürettiği bir dizi örneği yükledi.

Şirket, yayınlanan araştırmasında, “MusicLM, koşullu müzik oluşturma sürecini hiyerarşik bir diziden diziye modelleme görevi olarak yayınlıyor ve birkaç dakika boyunca tutarlı kalan 24 kHz’de müzik üretiyor” dedi.

Ayrıca Oku

Google'ın IO 2023'te sergilediği Android 14 özellikleri

Örnekler, paragraf uzunluğundaki açıklamalarla oluşturulduğu bildirilen 5 dakikalık şarkıları içeriyordu. Talimatlar ne kadar net olursa müzik de o kadar iyi olur dedi.

Araştırma makalesinde ayrıca, modele oluşturulması gereken her müzik türü için süre ile birden çok metin girişinin verildiği bir “hikaye modu” demosundan da bahsedildi. Örneğin model bu melodilerle bir şarkı oluşturabilir.

meditasyon zamanı (0:00-0:15)
uyanma zamanı (0:15-0:30)
çalışma zamanı (0:30-0:45)
%100 verme zamanı (0:45-0:60)

Araştırmacılar ayrıca, deneylerinin MusicLM’nin hem ses kalitesi hem de metin açıklamasına bağlılık açısından önceki sistemlerden daha iyi performans gösterdiğini gösterdi.

FacebooktwitterLinkedin



makalenin sonu



genel-9