- Nvidia, yeni Fugatto üretken yapay zeka ses aracını duyurdu
- Sesi her türlü şekilde oluşturup miksleyebilir, ancak henüz yayınlanmadı
- Fugatto benzersiz sesler, ses karışımları, konuşma ve daha fazlasını yaratmayı vaat ediyor
Nvidia duyurdu Fugatto adında yeni bir üretken yapay zeka ses aracı, “dünyanın en esnek ses makinesi” olarak tanımlanıyor; her türlü müzik, konuşma ve diğer sesleri, hatta daha önce hiç duyulmamış benzersiz sesleri üretebiliyor.
Temel Üretken Ses Transformatörü Opus 1’in kısaltması olan Fugatto, metin istemleri ve ses örnekleriyle çalışabilir. Ne duymak istediğinizi basitçe açıklayabilir veya AI modelinin mevcut ses kliplerini değiştirmesini veya birleştirmesini sağlayabilirsiniz.
Örneğin, bir trenin sesini muhteşem bir orkestra düzenlemesine dönüştürebilir veya bir banjo melodisini yağmur sesleriyle karıştırabilirsiniz. Sadece bir komut yazarak saksafonun havlamasını veya flütün miyavlamasını duyabilirsiniz.
Fugatto ayrıca vokalleri parçalardan ayırabiliyor, vokal iletim stilini değiştirebiliyor ve sıfırdan konuşma oluşturabiliyor. Mevcut bir melodiyi besleyin ve onu istediğiniz enstrümanda, istediğiniz tarzda çaldırabilirsiniz.
Kötü haber; henüz mevcut değil
Peki bu etkileyici yeni yapay zeka teknolojisini nasıl deneyebilirsiniz? Şimdilik yapamazsınız: Nvidia’nınkiyle yetinmek zorunda kalacaksınız. tanıtım videosu ve bir örneklerin bulunduğu web sitesi. Fugatto’nun ne zaman halka açık testlere açılacağına dair henüz bir bilgi yok.
Nvidia tarafından yayınlanan örneklerden bazıları arasında havlayan bir kadın sesi, bir fabrika makinesinin çığlıkları, bir daktilonun fısıldayan sesi ve öfkeyle bağıran bir çello sesi yer alıyor. Mümkün olan çok çeşitli ses efektlerini görebilirsiniz.
Nvidia ayrıca yapay zeka motorunun, daha sonra bir dizi farklı duygu (kızgınlıktan mutluluğa) ve hatta farklı aksanlar uygulanarak sunulabilen sözlü sözcük klipleri üretebildiğini de gösterdi.
“İnsanlar gibi sesi anlayan ve üreten bir model yaratmak istedik.” diyor Nvidia’dan Rafael ValleFugatto ekibinden biri. “Fugatto, ses sentezi ve dönüşümünde denetimsiz çoklu görev öğreniminin veri ve model ölçeğinden ortaya çıktığı bir geleceğe doğru attığımız ilk adımdır.”