Stability AI, geliştiricinin Stable Audio adı verilen yeni bir metinden sese dönüştürme motorunu piyasaya sürmesiyle üretken AI teknolojisini müzik dünyasına taşıyor.
Benzer Kararlı Difüzyon modeli, Stable Audio, basit bir metin istemine dayalı olarak kısa ses parçaları oluşturabilir. Şirket kendi açıklamasında şöyle açıklıyor: duyuru yazısı Yapay zekanın çevrimiçi müzik kütüphanesindeki içerik konusunda eğitildiğini SesSparx. Hatta modelin “ticari kullanım için yüksek kaliteli 44,1 kHz müzik” oluşturabildiğini bile iddia ediyor. Bu sayıyı perspektife koymak gerekirse, 44,1 kHz’in CD kalitesinde ses. Yani oldukça iyi ama en iyisi değil.
Stable Audio’nun ücretsiz sürümü şu anda halka açıktır ve ayda 20 ayrı parça oluşturup indirmenize izin verilmektedir. Her ses parçasının 45 saniyelik bir çalışma süresi vardır, bu nedenle çok uzun sürmeyeceklerdir.
Müzik istemi
Girdiğiniz metin istemleri basit girişler olabilir. Stability AI tarafından sağlanan örnekleri dinlerken, “Yandan Geçen Araba” sesi tam olarak başlığın önerdiği gibi geliyor – biraz boğuk olmasına rağmen uzaktan geçen bir araba. Tersine, ayrıntılara da yer verebilirsiniz. Belirli bir örnekte Ambient Techno, 808 davul makinesi, alkışlar, sentezleyici, “ruhani” kelimesi, 122 BPM ve “İskandinav Ormanı” (bu ne anlama geliyorsa) içeren bir komut istemi vardır. Bu kelime kombinasyonunun sonucu, ortamsal bir lo-fi hip-hop ritmidir.
Hızlı bir dönüş için Stable Audio’yu çıkardık. Yapay zekadan 2000’li yılların başlarından itibaren hızlı tempolu bir garaj rock şarkısı yaratmasını isteyen bir istemde bulunabildik ve bu bir nevi amacımıza ulaştı. Oluşturulan parça, gerçekten dağınık görünmesine rağmen stile uyuyordu.
Maalesef tek girişten öteye gidemedik. Bu yazının yazıldığı sırada, Stable Audio, modeli denemek için akın eden insanlardan büyük bir trafik akışı görüyor. Geliştirici, yalnızca boş bir ekranla karşılaşırsanız daha sonra veya ertesi gün tekrar denemenizi önerir.
Ücretsiz sürümde bir sorun var; yalnızca ticari olmayan kullanım içindir. İçeriği ticari olarak kullanmak istiyorsanız 12 ABD doları tutarındaki Stable Audio Professional aylık planını satın almanız gerekir. Ayrıca her biri 90 saniyeye kadar süren ayda 500 parça nesli sunuyor. Özel ses süresi ve aylık nesiller için bir Kurumsal plan da var. Ancak bir plan oluşturmak için önce Stability AI ile iletişime geçmeniz gerekecek.
Teknolojinin mükemmel olmadığını unutmayın. İçerik çoğunlukla kulağa hoş geliyor ancak bazı yönler yanlış görünebilir. Daha önce bahsettiğimiz Ambient Techno şarkısındaki mix bize göre pek iyi değil. Sanki bas ve sentezleyici baskın sesin ne olacağı konusunda kavga ediyor ve sonuçta sadece gürültü çıkıyordu. Ayrıca yapay zekanın vokal yapabildiği de görünmüyor. Sadece enstrümantal çalıyor.
Stabil Ses kesinlikle ilginç, ancak tamamen güvenilmesi gereken bir şey değil. Şirketin, yapay zekanın nasıl geliştirilebileceği konusunda kullanıcılardan geri bildirim istediğini unutmamalıyız. Resmi duyuru sayfasında bir iletişim e-postası bulunabilir.
Bu teknolojiyi kendi amacınız için kullanmayı planlıyorsanız TechRadar’ın 2023’ün en iyi ses editörleri Karşılaşabileceğiniz herhangi bir kusuru düzeltmek için.