Gemini AI, Google’ın tartışmalı çıktıları nedeniyle selefini devre dışı bırakmasından birkaç ay sonra Imagen 3 adlı yeni bir görüntü oluşturma modeli alıyor. Arama devi, Anahtar Kelime dün, “Imagen 3, yerleşik güvenlik önlemleriyle gelen ve ürün tasarım ilkelerimize uyan gelişmiş görüntü oluşturma yetenekleri getiriyor.” dedi.
Google’ın Gemini’deki Imagen 2 görüntü oluşturma özelliği, Şubat ayında tarihi konuların oldukça yanlış tasvirlerini ürettiğinde manşetlere çıktı. Şirket, yapay zeka görüntü oluşturma aracının önyargı ve gerçek insanların tasvirleri tuzaklarından kaçınmasını istiyordu. Ancak, daha kapsayıcı olma çabasıyla, yarattığı araç spektrumun diğer ucuna çok fazla gitti ve burada biraz önyargı vardı aykırı açık tenli insanlar.
Bu sorun, X kullanıcısı End Wokeness’ın “Amerika’nın Kurucu Babalarının Portresi” için sonuçların bir Kızılderili adam, bir Asyalı adam ve iki koyu tenli adam gösterdiği gönderisiyle viral oldu. Hatta görüntü oluşturucunun, renkli insanların Nazi askerleri olarak gösterildiği, son derece yanlış tasvirler yaptığı noktaya bile geldi.
Google AI’ya göre Amerika’nın Kurucu Babaları, Vikingler ve Papa: pic.twitter.com/lw4aIKLwkp21 Şubat 2024
Yeni AI teknolojileri, özellikle bu programlar insanlık tarihi ve etiği hakkında hiçbir anlayışa sahip olmadığından, bu sorunlarla başa çıkmak zorundadır. Bu nedenle, Microsoft’un Copilot Designer’ı gibi AI araçları, istemeden kınanacak görüntüler üretebilir. Google, görüntü oluşturma aracının bu kültürel klişelerden ve önyargılardan kaçınmasını sağlayarak bunu düzeltmeye çalıştı. Ancak, beklenmeyen sonuçlarından biri, Imagen 2 aracının tarihsel olarak yanlış ve bazen de aşırı derecede saldırgan hale gelecek kadar kapsayıcı hale gelmesiydi. Bu tartışma nedeniyle, Google, Imagen 2’yi düzeltmek için lansmanından üç hafta sonra kaldırmak zorunda kaldı.
Şirket, görüntü oluşturma aracını birkaç hafta içinde yeniden başlatacağını söyledi ve sonunda geri çekilmeden yaklaşık 20 hafta sonra bunu yaptı. The Keyword blog yazısına göre, Imagen 3 “fotogerçekçi, tanımlanabilir bireylerin, küçüklerin tasvirlerinin veya aşırı kanlı, şiddet içeren veya cinsel sahnelerin oluşturulmasını desteklemiyor.” Yine de, üretici AI aracının hatalar yapabileceğini kabul ediyor, ancak Google kullanıcı geri bildirimleriyle onu geliştirmeye devam edeceğini söylüyor.
Imagen 3, önümüzdeki günlerde Gemini kullanıcılarına sunulmaya başlayacak ve İngilizce dilindeki Gemini Advanced, Business ve Enterprise kullanıcıları ilk erişenler arasında yer alacak. Araç teknik iyileştirmeler ve daha iyi veri kümeleri almış, yoğun testlerden geçmiş ve net ürün prensipleri sunulmuş olduğundan daha iyi, daha doğru ve daha az saldırgan sonuçlar elde etmeyi umuyoruz.