StabilityAI, daha uzun parçalar, sesten sese destek ve yaratıcıların telif haklarını korumaya daha fazla bağlılık sunan yapay zekalı müzik oluşturma aracının ikinci versiyonunu duyurdu.
Stable Audio 2.0, kullanıcıların “Güzel bir piyano arpeji tam anlamıyla güzel bir orkestra parçasına dönüşüyor”, “Lo-fi funk” veya “davul solosu” gibi doğal bir dil işleme komutunu girerek 44,1 kHz stereoda üç dakikalık parçalar oluşturmasına olanak tanıyor. Yapay zeka tarafından oluşturulan parçalar, giriş, geliştirme, çıkış ve stereo ses efektleri gibi yapılandırılmış kompozisyonlar içerir.
tarafından sunulan bir diğer yeni özellik Sabit Ses 2.0 Yalnızca metinden sese dönüştürme aracından gelişen, platforma bir ses dosyası yükleyerek “tamamen üretilmiş örnekler” oluşturma yeteneğini içerir. Örneğin, sesinizle bir davul sesini taklit ettiğinizde uygulama, davul çalan bir ses klibini oluşturmaya yönlendirir.
Telif hakkını ciddiye almak
Yeni sesten sese özelliğini kullanırken kullanıcılar, StabillityAI’nin koşulları kapsamında telif hakkıyla korunan materyalleri yüklemekten kaçınmalıdır. Bu politikaya uygunluğu sağlamak ve herhangi bir telif hakkı ihlalini önlemek için içerik tanıma teknolojisini kullanır.
Stable Audio 1.0’da olduğu gibi, ikinci model de AudioSparx’ın 800.000 müzik, ses efektleri, tek enstrüman gövdeleri ve metin tabanlı meta verilerden oluşan geniş ses dosyası kitaplığı üzerinde eğitilmiştir. Eserlerinin yapay zeka modeli eğitimi için kullanılması fikrinden memnun olmayan AudioSparx müzisyenleri, bu seçeneği seçme fırsatına sahip oldu.
Stability AI’de Ses ekibine liderlik etme görevimden istifa ettim çünkü şirketin, telif hakkıyla korunan çalışmalar üzerinde üretken AI modellerinin eğitiminin ‘adil kullanım’ olduğu yönündeki görüşüne katılmıyorum.Öncelikle şunu söylemek istiyorum: Stability’deki insanların derinden…15 Kasım 2023
Bu güçlendirilmiş telif hakkı ihlali ve içerik oluşturucunun devre dışı bırakılması politikaları, eski ses başkan yardımcısı Ed Newton-Rex’in yakın zamanda ayrılmasının ardından geldi. İstifasını Kasım 2023’te bir açıklamayla duyurdu. X gönderisi Bu, şirketin içerik oluşturucuların haklarını korumaya yönelik yaklaşımını ağır bir şekilde eleştirdi.
“StabilityAI’de Ses ekibine liderlik etme görevimden istifa ettim çünkü şirketin, telif hakkıyla korunan çalışmalar üzerinde üretken yapay zeka modellerinin eğitiminin ‘adil kullanım’ olduğu yönündeki görüşüne katılmıyorum” diye yazdı.
Görevini, yaratıcıları teknoloji şirketlerinin “yaratıcıları sömürmenin üretken yapay zekada uzun vadeli bir çözüm olamayacağını anlamalarını” sağlamak için endişelerini dile getirmeye çağırarak tamamladı.
Kaputun altında
Daha uzun parçalar ve sesten sese desteğine ek olarak Stable Audio 2.0, güçlendirilmiş bir mimariye sahiptir. “tutarlı yapılara sahip tam parçaların oluşturulmasını” kolaylaştırır. Sistemin her bileşeninin uyarlanmasının “uzun vadede performansın arttığını” iddia ettiler.
Araç, ham ses dalga biçimlerini sıkıştırarak daha kısa ses temsilleri oluşturan yeni bir tür sıkıştırılmış otomatik kodlayıcıya sahiptir. Bu arada, güç sağlayana benzer bir difüzyon transformatörü Kararlı Difüzyon 3 – daha uzun dizi verilerini işleyebilir.
Stability AI bir blog yazısında “Bu iki unsurun birleşimi, yüksek kaliteli müzik kompozisyonları için gerekli olan büyük ölçekli yapıları tanıyabilen ve yeniden üretebilen bir modelle sonuçlanıyor” diye yazdı.
Aracın kullanımı ücretsizdir ve hemen kullanılabilir.