Google duyurdu Whisk adlı yeni bir yapay zeka aracı Bu, uzun bir metin istemi gerektirmek yerine diğer görüntüleri bilgi istemi olarak kullanarak görüntüler oluşturmanıza olanak tanır.

Whisk ile yapay zeka tarafından oluşturulan görüntünüzün konusu, sahnesi ve stili olarak neyi istediğinizi öneren görüntüler sunabilir ve Whisk’i bu üç şeyin her biri için birden fazla görüntüyle yönlendirebilirsiniz. (İsterseniz metin istemlerini de doldurabilirsiniz.) Elinizde görsel yoksa, Google’ın istemler için bazı görselleri doldurmasını sağlamak üzere bir zar simgesini tıklayabilirsiniz (ancak bu görseller aynı zamanda yapay zeka tarafından oluşturulmuş gibi görünüyor). Aradığınız görüntü hakkında ekstra ayrıntı eklemek isterseniz, işlemin sonunda metin kutusuna bir miktar metin de girebilirsiniz, ancak bu gerekli değildir.

Whisk daha sonra her görüntü için görüntüler ve bir metin istemi oluşturacaktır. Sonuçlardan memnunsanız görseli favorilere ekleyebilir veya indirebilirsiniz ya da metin kutusuna daha fazla metin girerek veya görsele tıklayıp metin istemini düzenleyerek görseli hassaslaştırabilirsiniz.

Whisk’in ekran görüntüsü. Bir konu, sahne ve stil oluşturmak için zarlara tıkladım. Bir metin istemi girerek otomatik olarak oluşturulan sahneyi değiştirdim. Whisk ilk iki görüntüyü oluşturdu, ben de Whisk’ten nesnenin etrafına biraz buhar eklemesini isteyerek (çünkü bu sudaki bir ateştir) bunu tekrarladım ve sonraki iki görüntü ortaya çıktı.
Jay Peters / The Verge’ın ekran görüntüsü

İçinde bir blog yazısıGoogle, Whisk’in “piksel mükemmelliğinde düzenlemeler için değil, hızlı görsel keşif” için tasarlandığını vurguluyor. Şirket ayrıca Whisk’in “işareti kaçırabileceğini” ve bu nedenle temel istemleri düzenlemenize izin verdiğini söylüyor.

Bu hikayeyi yazarken aracı kullandığım birkaç dakika içinde, onu kurcalamak çok eğlenceli oldu. Görsellerin oluşturulması birkaç saniye sürüyor, bu da sinir bozucu ve görseller biraz tuhaf olsa da ürettiğim her şeyin üzerinde tekrarlanması eğlenceliydi.

Google, Whisk’in Imagen 3 görüntü oluşturma modelinin “en son” yinelemesini kullandığını söylüyor. bugün duyurdu. Google ayrıca, şirketin “sinematografinin benzersiz dili” anlayışına sahip olduğunu ve ekstra parmaklar gibi şeyleri diğer modellere göre “daha az sıklıkta” halüsinasyona uğrattığını söylediği video oluşturma modelinin bir sonraki sürümü olan Veo 2’yi de tanıttı (diğer modellerden biri muhtemelen OpenAI’nin Sora’sıdır). Veo 2, Google Labs bekleme listesine girebileceğiniz Google’ın VideoFX’inde ilk sırada yer alıyor ve önümüzdeki yıl YouTube Shorts “diğer ürünlerini” de kapsayacak şekilde genişletilecek.



genel-2