Ocak ayında Google, kelime komutlarına dayalı melodiler oluşturan yapay zeka tabanlı müzik oluşturma yazılımı üzerine bazı araştırmaları sessizce yayınladığında bazı dalgalar (ses dalgaları) yarattı. Bugün kardeş işletmesi Google DeepMind birkaç adım daha ileri gitti: duyuruldu adında yeni bir müzik kuşağı modeli ortaya çıktı Lyria Bu çalışacaktır YouTube ile birlikte; ve Lyria üzerine inşa edilmiş “deneyler” olarak tanımladığı iki yeni araç seti. Dream Track, YouTube Shorts için müzik oluşturmanıza olanak tanıyacak; ve Müzik Yapay Zekası araçlarının, yaratıcı sürece yardımcı olmayı amaçladığını söylüyor: örneğin, bir yaratıcının mırıldanabileceği bir parçadan bir melodi oluşturmak. Bunların yanı sıra DeepMind, AI görüntülerini işaretlemek için kullanılan SynthID’yi de AI müziğine filigran eklemek için uyarladığını söyledi.
Yeni araçlar, yapay zekanın yaratıcı sanatlar dünyasında tartışmalara yol açmaya devam ettiği bir dönemde piyasaya sürülüyor. Bu, Screen Actors Guild’in (nihayet bu ay sona eren) grevinin merkezinde yer alan önemli bir konuydu; ve müzikte, herkes Ghostwriter’ın Drake ve The Weeknd’i taklit etmek için yapay zekayı kullandığını biliyorken: sormanız gereken soru, yapay zeka yaratmanın gelecekte daha fazla norm haline gelip gelmeyeceğidir.
Bugün duyurulan yeni araçlarla birlikte DeepMind ve YouTube’un birinci önceliği, hem günümüzün yaratıcılarına bir tamamlayıcı olarak hem de müzik gibi ses veren en estetik anlamda yapay zeka müziğinin güvenilir kalmasına yardımcı olacak teknoloji yaratmak gibi görünüyor.
Google’ın geçmiş çabalarının gösterdiği gibi, sıklıkla ortaya çıkan bir ayrıntı, yapay zeka tarafından üretilen müzik ne kadar uzun süre dinlerse, sesin o kadar çarpık ve gerçeküstü gelmeye başlaması ve amaçlanan sonuçtan uzaklaşmasıdır. DeepMind’ın bugün açıkladığı gibi, bunun nedeni kısmen müzik modellerine giren, vuruşları, notaları, armonileri ve daha fazlasını kapsayan bilgilerin karmaşıklığıdır.
DeepMind bugün şunları kaydetti: “Uzun ses dizileri üretirken yapay zeka modellerinin cümleler, dizeler veya uzun pasajlar boyunca müzikal sürekliliği sürdürmesi zordur.” “Müzik çoğu zaman birden fazla ses ve enstrümanı aynı anda içerdiğinden, yaratmak konuşmayı oluşturmaktan çok daha zordur.”
Dolayısıyla modelin ilk uygulamalarından bazılarının daha kısa parçalar halinde ortaya çıkması dikkat çekici.
Dream Track, başlangıçta Alec Benjamin, Charlie Puth, Charli XCX, Demi Lovato, John Legend, Sia, T- gibi sanatçıların ses ve müzik tarzında 30 saniyelik yapay zeka tarafından oluşturulan müzikler oluşturmak üzere sınırlı sayıda yaratıcıya sunuluyor. Pain, Troye Sivan ve Papoose.”
İçerik oluşturucu bir konu girer, bir sanatçı seçer ve şarkı sözlerini içeren bir parça, arka plan parçaları ve seçilen müzisyenin sesi, Shorts’la kullanılması amaçlanan 30 saniyelik parçayı oluşturmak için kullanılır. Burada bir Charlie Puth şarkısı örneği var:
YouTube ve DeepMind, bu sanatçıların projeye dahil olduklarını, modellerin test edilmesine yardımcı olduklarını ve başka girdiler sağladıklarını açıkça belirtiyorlar.
Sırasıyla YouTube’un müzik başkanı ve yeni deneyimler ve topluluk projelerinden sorumlu Başkan Yardımcısı Lyor Cohen ve Toni Reed, piyasaya sürülen Müzik Yapay Zekası araçlarının, bir grup sanatçı ve şarkı yazarından oluşan şirketin Müzik Yapay Zekası İnkübatöründen çıktığını belirtiyorlar ve projeler üzerinde testler yapan ve geri bildirim veren üreticiler.
“Bu ilk katılımcı grubunun, mümkün olduğunu düşündüklerinin sınırlarını zorlayabilecek yapay zeka araçlarına yoğun bir şekilde meraklı oldukları başlangıçta açıktı” diye belirtiyorlar. “Ayrıca yaratıcı süreçlerini destekleyebilecek araçlar da aradılar.”
Dream Track bugün sınırlı sayıda yayınlanırken, Music AI araçlarının ancak bu yılın sonlarında kullanıma sunulacağını söylediler. DeepMind, ele alacakları üç alanı anlattı: belirli bir enstrümanda müzik yaratmak veya bir melodiyi mırıldanmaya dayalı bir enstrümantasyon seti oluşturmak; bütün bir koro veya başka bir topluluk oluşturmak için basit bir MIDI klavyede oluşturduğunuz akorları kullanmak; ve zaten sahip olabileceğiniz bir vokal hattı için destek ve enstrümantal parçalar oluşturmak. (Ya da aslında basit bir uğultuyla başlayan, bunların üçünü birden kullanan bir kombinasyon.)
Müzik alanında Google ve Ghostwriter elbette yalnız değil. Meta, araçları piyasaya süren diğerlerinin yanı sıra, Haziran ayında açık kaynaklı bir AI müzik oluşturucuyu da satın aldı; Stabilite Yapay Zekası Eylül ayında bir tane başlattı; ve Riffusion gibi girişimler de bu türdeki çabaları için para topluyor. Müzik endüstrisi de hazırlanmak için çabalıyor.