Yapay zeka destekli sanat yaratıcısı Stable Diffusion’ın arkasındaki startup olan Stability AI, piyasaya sürülmüş yalnızca telifsiz kayıtlar üzerine eğitildiğini iddia ettiği sesler ve şarkılar üretmek için açık bir yapay zeka modeli.

Stable Audio Open olarak adlandırılan, ücretsiz müzik kitaplıkları FreeSound ve Free Music Archive’dan yaklaşık 486.000 örnek kullanılarak eğitilen üretken model, bir metin açıklaması alır (örneğin, “İşlenmiş bir stüdyoda çalınan rock ritmi, akustik kit üzerinde davul çalma seansı”) ve çıktılar 47 saniyeye kadar uzunlukta bir kayıt.

Stability AI, modelin videolar, filmler ve TV şovları için davul ritimleri, enstrüman melodileri, ortam sesleri ve “prodüksiyon öğeleri” oluşturmanın yanı sıra mevcut şarkıları “düzenlemek” veya bir şarkının stilini uygulamak (örn. pürüzsüz) için kullanılabileceğini söylüyor caz) diğerine.

Stability AI, kurumsal blogunda yer alan bir gönderide, “Bu açık kaynak sürümünün önemli bir avantajı, kullanıcıların modele kendi özel ses verileri üzerinde ince ayar yapabilmesidir” diye yazıyor. “Örneğin, bir davulcu yeni ritimler oluşturmak için kendi davul kayıtlarının örneklerine ince ayar yapabilir.”

Ancak Stabil Ses Açık’ın sınırlamaları vardır. Tam şarkılar, melodiler veya vokaller üretemez; en azından iyi olanları. Stabilite AI bunun için optimize edilmediğini söylüyor ve kullanıcılara şunu öneriyor: onlar yetenekleri şirketin premium Stabil Ses hizmetini tercih ediyor.

Stable Audio Open ticari olarak da kullanılamaz; hizmet şartları bunu yasaklıyor. Ayrıca müzik tarzları ve kültürleri arasında veya İngilizce dışındaki dillerdeki açıklamalarda eşit derecede iyi performans göstermiyor; bu durum Stabilite Yapay Zekasının eğitim verilerini suçladığını gösteriyor.

Stability AI, bir yazısında şöyle yazıyor: “Veri kaynağı potansiyel olarak çeşitlilikten yoksun ve tüm kültürler veri setinde eşit şekilde temsil edilmiyor.” Tanım modelin. “Modelden oluşturulan örnekler, eğitim verilerinden gelen önyargıları yansıtacaktır.”

Kararlılık AI – sahip olduğu uzun süre mücadele edildi işaretleyen işini tersine çevirmek – son zamanlarda üretken sesten sorumlu Başkan Yardımcısı’nın ardından tartışmalara konu oldu, Ed Newton-Rex, şirketin telif hakkıyla korunan çalışmalar üzerinde üretken yapay zeka modellerinin eğitiminin “adil kullanım” teşkil ettiği yönündeki tutumuna karşı çıktığı için istifa etti. Stable Audio Open, bu anlatıyı tersine çevirme girişimi gibi görünüyor – aynı zamanda Stability AI’nin ücretli ürünlerinin reklamını o kadar da incelikli olmayan bir şekilde yapıyor.



genel-24