Teknoloji her zaman harika bir dengeleyici olmuştur. Sanayi çağından internet çağına kadar kitlelerin yaşam kalitesini artırdı ve daha önce hayal edilemeyen şeyleri daha erişilebilir hale getirdi. Binlerce kilometre uzakta oturan biriyle iletişim kurmanın ne kadar yaygın hale geldiğini ve çoğu kişinin bunu pek düşünmediğini anlamak için akıllı telefonlarına bakmak yeterli. Graham Bell’den önce bu tür uzun mesafeli iletişim, yüksek maliyetler nedeniyle yalnızca zengin ve nüfuz sahibi kişiler için mümkündü.

Bu tür örnekler sayısızdır. Dünya çapında gerçek bağlantı sağlayan sosyal medyadan, fiziksel varlık gerektiren ve günün saatlerini alan görevleri dijitalleştiren akıllı telefon uygulamalarına ve kurumsal merkezlerden uzakta yaşayan insanlara daha iyi kazanç fırsatları sunan uzaktan çalışmaya kadar teknoloji, erişilebilirliği demokratikleştirdi. Üretken yapay zeka (AI), pek çok açıdan erişilebilirliği yeni sınırlara taşıyacak bir sonraki meşale taşıyıcısı oldu.

Erişilebilirliğin büyük etki yaratabileceği alanlardan biri de müzik endüstrisidir. Spotify, SoundCloud, Apple Music ve daha fazlası gibi müzik dağıtımını daha ucuz hale getiren bağımsız akış platformlarının ortaya çıkmasına rağmen, hala devam eden sorun müzik yaratmaktır. Günümüzde orijinal fon müziği çok ihtiyaç duyulan bir üründür. Profesyonel sanatçılardan sosyal medya yaratıcılarına ve podcast yayıncılarına kadar herkes, platformların telif hakkı ihtarlarından (YouTube içerik oluşturucuları bunun etkisinin çok iyi farkındadır) veya davalardan kaçınmak için içerikleri için tercihen orijinal müzik parçalarına ihtiyaç duyar.

Ancak müzik yaratmak herkesin harcı değil. Muhtemelen, yıllardır bir veya daha fazla müzik enstrümanında ustalaşmak için eğitim almadıysanız, ancak profesyonel ihtiyaçlarınız için orijinal ve benzersiz müzik istiyorsanız, kendinizi yalnızca iki pahalı çözümle karşı karşıya bulacaksınız: bir müzik yapımcısı veya bir seans müzisyeni kiralamak veya para ödemek Stok müzik satın almak için çevrimiçi. Ama artık değil, çünkü yapay zekanın devreye girdiği yer burası.

Kullanıcıların on saniye içinde yeni ve benzersiz arka plan müziği oluşturmak için basit bir metin istemi yazmalarına olanak tanıyan, Hint yapay zeka destekli müzik oluşturma platformu Beatoven.ai örneğini ele alalım. Bu teknolojinin nasıl çalıştığını, çeşitli sonuçlarını ve böylesine yenilikçi bir girişimi yürütmenin deneyimini anlamak için Gadgets 360 olarak Beatoven.ai’nin kurucu ortağı ve CEO’su Mansoor Rahimat Khan ile konuştuk.

Beatoven.ai’nin başlangıcı ve yolculuğu

Mansur Rahimat Han Mansur Rahimat Han

Mansoor Rahimat Khan, Gadgets 360 Ödülleri’nde Beatoven.ai’nin CEO’su ve kurucu ortağı

Mansoor Rahimat Khan, yedi nesildir günümüz Sitar müziğini çalan ve şekillendiren ünlü bir müzisyen ailesi olan Sitar’ın Gwalior-Indore-Dharwad Gharana’sından geliyor. Khan da farklı değildi ama tutkularından biri olan teknoloji nedeniyle farklı bir yol seçti. “Mezuniyetimi Goa Ulusal Teknoloji Enstitüsü’nden (NIT) elektronik ve iletişim mühendisliği alanında tamamladım. Bu aynı zamanda müzik ve teknolojinin kesiştiği noktada yer alan alanı araştırmaya başladığım zamandı” dedi Khan bize.

Birkaç yıl çalıştıktan sonra Khan, Hindistan Teknoloji Enstitüsü (IIT), Allahabad (şimdi Prayagraj olarak biliniyor) mezunu ve bir müzik tutkunu olan Siddharth Bhardwaj ile tanıştı. Benzer ilgi alanlarını paylaşan ikili, içerikteki müzik lisanslama sorununu belirledi ve ister sosyal medyada ister profesyonel olarak kariyer peşinde koşan milyonlarca yaratıcının müziği daha erişilebilir hale getirebilecek bir şey oluşturmak istedi. Beatoven.ai’nin doğuşu buydu.

Ama bir sorun vardı. İkili, 2021’de ürün ve startup üzerinde çalışmaya başladığında bile, soruna çözüm bulmaları için üretken yapay zeka gerekiyordu ve bu da ana akıma ulaşmaya hâlâ bir yıl uzaktaydı (Kasım 2022’de ChatGPT, muhtemelen yeni yapay zeka yarışını başlattı).

“Başlangıçta 2021’de ürettiğimiz prototip oldukça basit bir platformdu. Kullanıcılar bir tür ve tempo seçip bir süre belirleyebilir ve biz de orijinal bir müzik parçası oluşturabiliriz. O zamanlar büyük dil modelleri (LLM) yoktu, bu nedenle tüm teknoloji yığınımızı sıfırdan oluşturmak zorunda kaldık. Bugün, o zamanlar geliştirmeye başladığımız kendi özel teknolojimiz var” dedi Khan.

Yapay zeka dalgasının ortaya çıkmasıyla işler daha kolay hale geldi ve Beatoven.ai, piyasadaki yüksek lisans programlarının varlığından faydalandı ve bu sayede platformlarını mevcut bir milyonluk kullanıcı tabanına hitap edecek şekilde daha iyi donatabildi.

Beatoven.ai platformu

Yalnızca web platformu, içerik oluşturuculara yönelik üretken, yapay zeka destekli bir müzik oluşturma aracıdır. Kullanıcılar kaydolduktan sonra orijinal arka plan müziği oluşturmak için bir metin istemi yazabilirler. Alternatif olarak platform, kullanıcıların müzik oluşturmak için tempo, süre, tür ve ruh hali seçmelerine de olanak tanıyor.

Kullanıcı girişi ekledikten sonra yapay zeka görevi devralır ve dört ayrı parça oluşturur. Platform ayrıca kullanıcıların bir enstrümanı değiştirebileceği, belirli bölümlerde ses seviyesini azaltabileceği veya artırabileceği veya parçanın tüm bir bölümünü yeniden oluşturabileceği post-jenerasyon düzenleme özellikleri de sunuyor. Khan, tek bir parçanın 15 dakikaya kadar uzunlukta olabileceğini, ancak üst sınır olmadığını ve önerilen değerin oluşturma süresini kısa tutmak için mevcut olduğunu söyledi. Ortalama 1-2 dakikalık bir parçanın oluşturulması yaklaşık 10 saniye sürecektir. Şirketin paylaştığı verilere göre Beatoven, kuruluşundan bu yana 15 lakh film müziği üretti ve 3 lakh indirmeyle övünüyor.

Platform şu anda kullanıcıların iki veya daha fazla türün harmanlandığı füzyon parçaları oluşturmasına izin vermiyor ancak Khan, Gadgets 360’a özel olarak şirketin yakında bu özelliği ekleyecek yeni bir güncelleme yayınlayacağını söyledi.

Ayrıca platformu test ettik ve müziğin oldukça gerçekçi olduğunu gördük. Aşağıdaki şarkı, “Dans partisi için mükemmel olan vuruş düşüşüyle ​​yüksek enerjili bir EDM marşı oluşturun” istemi kullanılarak oluşturuldu.

Beatoven.ai teknoloji yığını

Beatoven platformunun iki bileşeni vardır. Bunlardan ilki, kullanıcıların istemleri doğal dilde yazmalarına ve daha sonra bu bilgileri yapay zekanın anlayabileceği bir formatta işleyip müziğe dönüştürmelerine olanak tanıyan LLM’dir. Startup bu kısım için GPT modellerini kullanıyor.

İkinci bileşen kullanıcının amacını anlar ve parametreyi karşılayan bir parça oluşturur. Bu mimari şirket tarafından yerel olarak oluşturuldu. Yapay zeka modeli bunu gerçekleştirmek için karşılaştırmalı öğrenme mimarisini kullanıyor. Khan, bu tekniğin ilhamının OpenAI’nin CLIP modelinden geldiğinin altını çiziyor ancak hemen OpenAI modelinin metin ve görseller için tasarlandığını ve bunu ses ve müzik için ilk kullananın Beatoven olduğunu belirtiyor. Tescilli bir çalışma olması nedeniyle şirket süreci de optimize edebildi. Örneğin Khan bize platformun GPU çıkarımı yerine CPU çıkarımını kullandığını söyledi. Küçük LLM’lerin bile çalıştırılması için GPU çıkarımına ihtiyaç duyduğu göz önüne alındığında bu dikkate değerdir.

Başlangıç, yapay zeka modelini eğitmek için bağımsız sanatçılardan neredeyse 1.00.000 veri örneği aldı. Şirket dünya çapında yaklaşık 250 sanatçıyla işbirliği yaptı ve onlara özel parçalar için ödeme yaptı. Khan, şirketin tüm eğitim verilerini etik olarak elde ettiğini ve bunun için interneti araştırmadığını iddia etti. İlginç bir şekilde, Adobe’nin şu anda bir AI video oluşturma modeli oluşturmak için aynı şeyi yaptığı bildiriliyor.

Ancak günümüzde veriler, yapay zeka modellerini yükseltmek ve geliştirmek için sürekli olarak gerekli olan, inanılmaz derecede maliyetli bir kaynak haline geldi. Beatoven bugün bile veri elde etmek için sanatçılarla işbirliği yapma uygulamasını sürdürürken, gelecekte yapay zekanın şarkıyı kullandığı yerde oluşturulan parça sayısına göre sanatçılara ödeme yapılacağı bir gelir paylaşımı modeli sunarak maliyetleri düşürmeyi planlıyor. örnek veya veriler.

Beatoven.ai rekabetle nasıl başa çıkmayı planlıyor?

Yapay zeka tabanlı müzik üretimi bugün tamamen benzersiz bir teklif değil. Pek çok oyuncu potansiyelin farkına vararak bu segmente girdi. Bazıları arasında MusicLM ile Google, Jukebox ile OpenAI ve Project Music GenAI Control ile Adobe yer alıyor. Ancak bu modellerin hiçbiri bugün halka açık değil ve geliştirme aşamasındadır. Ancak Beatoven için rekabet hâlâ mevcut. Onlar için büyük bir rakip, yalnızca müzik yaratmakla kalmayıp aynı zamanda tam teşekküllü bir şarkı sunmak için müziğe yapay zeka tarafından oluşturulan sesleri de ekleyen Suno AI olacaktır.

Khan, endişeye yanıt olarak şirketin ücret sınırı eklemeden sınırsız müzik üretimi sunduğunu vurguladı. Ayrıca şirketin bütün bir ekosistem inşa ettiğinin altını çiziyor. Bir yandan müzik üreterek kullanıcılara hitap ederken, diğer yandan sanatçılara orijinal müziklerini satabilecekleri bir alan sunuyor. Khan, “etik kaynaklı ve telif hakkı içermeyen benzersiz müzik” vaadiyle birlikte sunulan tüm tekliflerin, Beatoven’a pazarda avantaj sağladığına inanıyor.

Geleceğe doğru bir bakış

Beatoven şimdi küresel bir kullanıcı tabanına hitap edecek şekilde platformunu genişletmeyi düşünüyor. Kullanıcı tabanının yüzde 70’i ülke dışında ikamet eden girişim, dünyanın farklı yerlerinden sanatçıları bünyesine katmaya başladı bile. Khan, yapay zeka modelini geliştirmeye odaklanmanın yanı sıra bu küresel görünümün önümüzdeki iki yıl içinde beş milyon kullanıcı hedefine ulaşmanın anahtarı olacağına inanıyor.

Teknoloji çoğu zaman iki ucu keskin bir kılıç olabilir. Yapay zeka tarafından üretilen müziğin faydaları küçümsenemezken, ortaya çıkan soru bu kadar kolay ve uygun fiyatlı müzik yaratmanın müzisyen adayları üzerinde olumsuz bir etkisi olup olmayacağıdır. Müziğin metalaştırılması gerçekten doğru yol mu?

Khan, müzik yaratmanın sektördeki bir sonraki büyük değişim olacağını ancak bunun müzisyenlerin ve şarkıcıların hayallerini ve geçim kaynaklarını ortadan kaldırmasının pek mümkün olmadığına inanıyor. “Sanatçıların hâlâ bu bozulmanın merkezinde olacağına inanıyorum çünkü yapay zeka insan yaratıcılığıyla rekabet edemez” dedi.


Bağlı kuruluş bağlantıları otomatik olarak oluşturulabilir; ayrıntılar için etik bildirimimize bakın.



genel-8