Google, DeepMind ve Google Brain’i büyük bir yapay zeka ekibinde birleştirdi ve Çarşamba günü yeni Google DeepMind, görsel dil modellerinden (VLM) birinin keşfedilebilirliğe yardımcı olabilecek YouTube Shorts için açıklamalar oluşturmak üzere nasıl kullanıldığına ilişkin ayrıntıları paylaştı.
“Kısa videolar yalnızca birkaç dakika içinde oluşturuluyor ve genellikle arama yoluyla bulunmalarını zorlaştıran açıklamalar ve yardımcı başlıklar içermiyor.” DeepMind gönderide yazdı. Flamingo, neler olup bittiğini açıklamak için bir videonun ilk karelerini analiz ederek bu açıklamaları yapabilir. (DeepMind, “kafasının üzerinde bir yığın krakeri dengede tutan bir köpek” örneğini verir.) Metin açıklamaları, “videoları daha iyi kategorize etmek ve arama sonuçlarını görüntüleyen sorgularıyla eşleştirmek” için meta veri olarak depolanacak.
Google DeepMind’ın baş işletme sorumlusu Colin Murdoch, bunun gerçek bir sorunu çözdüğünü söylüyor Sınır: Kısa videolar için, içerik oluşturucular bazen bir video oluşturma süreci daha uzun bir videoya göre daha akıcı olduğundan meta veri eklemezler. Shorts’un ürün yönetimi direktörü Todd Sherman, Shorts’un çoğunlukla insanların aktif olarak göz atmak yerine bir sonraki videoya kaydırdığı bir akışta izlendiğinden, meta verileri eklemek için çok fazla teşvik olmadığını ekledi.
Sherman, “Bu videoları anlama ve bize açıklayıcı metin sağlama yeteneği olan bu Flamingo modeli, zaten bu meta verileri arayan sistemlerimize yardımcı olmak için gerçekten çok değerli,” diyor. “Bu videoları daha etkili bir şekilde anlamalarını sağlıyor, böylece kullanıcılar onları aradıklarında bu eşleşmeyi yapabiliyoruz.”
Oluşturulan açıklamalar kullanıcıya yönelik olmayacaktır. Sherman, “Perde arkasındaki meta verilerden bahsediyoruz” diyor. “Bunu içerik oluşturuculara sunmuyoruz, ancak doğru olduğundan emin olmak için çok çaba harcıyoruz.” Sherman, Google’ın bu açıklamaların doğru olduğundan nasıl emin olduğuna gelince, “açıklayıcı metnin tamamı sorumluluk standartlarımızla uyumlu olacak” diyor. “Bir şekilde bir videoyu kötü bir şekilde çerçeveleyen açıklayıcı bir metnin oluşturulması pek olası değildir. Bu hiç de tahmin ettiğimiz bir sonuç değil.”
Flamingo, otomatik olarak oluşturulan açıklamaları yeni Shorts yüklemelerine zaten uyguluyor
DeepMind sözcüsü Duncan Smith’e göre Flamingo, otomatik olarak oluşturulan açıklamaları yeni Shorts yüklemelerine zaten uyguluyor ve bunu “en çok izlenen videolar da dahil olmak üzere mevcut videolardan oluşan büyük bir külliyat” için yaptı.
Flamingo’nun daha uzun biçimli YouTube videolarına uygulanıp uygulanmayacağını sormak zorunda kaldım. Sherman, “Bence olabileceği tamamen düşünülebilir,” diyor. “Yine de ihtiyacın muhtemelen biraz daha az olduğunu düşünüyorum.” Daha uzun biçimli bir video için bir içerik oluşturucunun ön prodüksiyon, filme alma ve düzenleme gibi şeylere saatler harcayabileceğini, bu nedenle meta veri eklemenin video oluşturma sürecinin nispeten küçük bir parçası olduğunu belirtiyor. İnsanlar genellikle bir başlık ve küçük resim gibi şeylere dayalı olarak daha uzun biçimli videolar izlediğinden, bunları yapan içerik oluşturucular, keşfedilebilirliğe yardımcı olan meta veriler eklemeye teşvik edilir.
Sanırım buradaki cevap, bekleyip görmemiz gerektiğidir. Ancak Google’ın sunduğu neredeyse her şeye yapay zekayı dahil etme konusundaki büyük çabası göz önüne alındığında, Flamingo gibi bir şeyi daha uzun biçimli YouTube videolarına uygulamak, gelecekte YouTube aramasında büyük bir etkisi olabilecek olasılıklar dünyasının dışında görünmüyor.