Meta, Google’ın NotebookLM’sinde viral bir podcast oluşturma özelliğinin “açık” bir uygulamasını yayınladı.
İsminde DefterLlamaProje, şaşırtıcı olmayan bir şekilde, işlemenin çoğu için Meta’nın kendi Llama modellerini kullanıyor. NotebookLM gibi, kendisine yüklenen metin dosyalarının ileri geri, podcast tarzı özetlerini oluşturabilir.
NotebookLlama ilk önce bir dosyadan bir metin oluşturur; örneğin bir haber makalesinin veya blog yazısının PDF’si. Ardından, transkripti açık metinden konuşmaya modellere beslemeden önce “daha fazla dramatizasyon” ve kesintiler ekler.
Sonuçlar NotebookLM kadar iyi görünmüyor. DefterdeLlama örnekler Dinledim, seslerin çok bariz bir şekilde robotik bir niteliği var ve tuhaf noktalarda birbirleriyle konuşma eğilimindeler.
Ancak projenin arkasındaki Meta araştırmacıları, daha güçlü modellerle kalitenin artırılabileceğini söylüyor.
NotebookLlama’nın GitHub sayfasında “Metinden konuşmaya modeli bunun kulağa ne kadar doğal geleceğini sınırlıyor” diye yazdılar. “[Also,] Podcast yazmanın başka bir yaklaşımı da iki temsilcinin ilgilenilen konuyu tartışmasını ve podcast taslağını yazmasını sağlamak olabilir. Şu anda podcast taslağını yazmak için tek bir model kullanıyoruz.”
NotebookLlama ilk değil girişim NotebookLM’nin podcast özelliğini kopyalamak için. Bazı projeler diğerlerinden daha fazla başarı elde etti. Ancak hiçbiri, hatta NotebookLM’in kendisi bile tüm yapay zekanın peşini bırakmayan halüsinasyon sorununu çözmeyi başaramadı. Yani yapay zeka tarafından oluşturulan podcast’ler bazı uydurma şeyler içermek zorunda.