- Google Whisk, metin tabanlı istemler yerine girdi olarak görselleri kullanıyor
- Google’ın Imagen 3 üretken yapay zeka modeli üzerine kurulmuştur
- Deneysel aracın ABD’deki kullanıcılar için denemesi ücretsizdir
Google’ın yeni yapay zeka aracı, görsel konseptlerinizi oluşturmanızı ve yeniden düzenlemenizi kolaylaştırır. Whisk, aklınızdan geçeni açıklamanızı istemek yerine üç görüntü istemi girmenizi sağlar: biri konu için, biri sahne için ve biri de stil için. Gerisini Whisk ile halleder ve farklı fikirleri denemenin daha sezgisel bir yolunu sunar.
En iyi AI görüntü oluşturucuların çoğu ayrıntılı bir bilgi istemi yazmanızı gerektirse de, Whisk bunu perde arkasında hallediyor. İlham olarak web tabanlı Whisk arayüzüne resim bıraktığınızda, Google’ın Gemini modeli bunları otomatik olarak analiz eder ve her biri için ayrıntılı bir başlık yazar. Bunlar daha sonra eşleşen bir görüntü oluşturmak için Imagen 3 modeline beslenir.
Örneğin, konu olarak bir arabanın resmini ve sahne olarak da kırsal bir manzaranın fotoğrafını ekleyebilirsiniz. Whisk’in ne yarattığını görmek için stil olarak sulu boya ekleyebilirsin. Düğmeye bastığınızda girişlerinize göre bir çift resim elde edersiniz.
Buradan görüntüleri yeniden karıştırmak kolaydır. Arayüz, sonuçları ayarlamak için ek metin tabanlı ayrıntılar belirtmenize olanak tanır. İlhama ihtiyacınız varsa kolayca farklı kaynak görselleri ekleyebilir veya zar atabilirsiniz. Yeni sonuçlar feed’de çiftler halinde görünür ve bu da onu fikir üretmenin sezgisel bir yolu haline getirir. Ayrıca metin istemini ortaya çıkararak ve daha fazla ayrıntı ekleyerek görüntüleri hassaslaştırmayı da seçebilirsiniz.
Çırpın
Whisk, metin tabanlı istemlere olan ihtiyacı ortadan kaldıracak şekilde tasarlanmış olsa da, sonuçlar her zaman kaynak materyalle eşleşmeyeceği için Google, yazılı istemleri hassaslaştırma seçeneğini içerir.
bir blog yazısı Deneysel araçla ilgili olarak Google, Whisk’in “konunuzun tam bir kopyasını değil özünü yakaladığını” açıklıyor. Bu ancak Gemini’nin gönderdiğiniz görselleri analiz etmesi kadar etkilidir. Bu genellikle çok etkileyici olsa da, aklınıza da giremez: Whisk’in bir görüntüden bir ayrıntıyı çıkarıp diğerine odaklanmasını bekleyebilirsiniz.
Gönderi daha ayrıntılı olarak açıklıyor: “Whish, görüntünüzden yalnızca birkaç temel özelliği çıkardığından, beklentilerinizden farklı görüntüler oluşturabilir. Örneğin, oluşturulan nesnenin boyu, kilosu, saç modeli veya cilt tonu farklı olabilir. Bu özelliklerin projeniz için çok önemli olabileceğini ve Whisk’in hedefi kaçırabileceğini biliyoruz, bu nedenle temel istemleri istediğiniz zaman görüntüleyip düzenlemenize izin veriyoruz.”
Bu eksikliklere rağmen Whisk, Google’ın mevcut yapay zeka araçlarının ilginç bir uygulamasını sunuyor. Temel üretken modeller, Gemini ile metin arayüzü aracılığıyla sohbet ediyormuşsunuz gibi aynıdır. Ancak görüntü girdilerine güvenen Whisk, görsel yaratıcıların fikirleriyle oynaması için daha erişilebilir ve sezgisel bir yoldur.
Google, dijital yaratıcılardan gelen erken geri bildirimlere dayanarak, Whisk’i “piksel mükemmelliğinde düzenlemeler değil, hızlı görsel keşif” için tasarlanmış “yeni bir tür yaratıcı araç” olarak adlandırıyor.
Google Whisk nasıl denenir
Google Whisk şu anda yalnızca ABD’deki kullanıcılara sunulmaktadır. Orada bulunuyorsanız web tarayıcınız aracılığıyla labs.google/whisk adresinden deneyebilirsiniz.
Deneysel araçla oynamak tamamen ücretsizdir. Whisk ile olan deneyiminizden elde edilen veriler, gelecekteki yapay zeka ürünlerinin iyileştirilmesine ve geliştirilmesine yardımcı olmak için Google’a geri iletilecektir.


