Google, Perşembe günü görüntü üretimi için şirket içi yapay zeka (AI) modeli Imagen 3’ü yayınladı. Teknoloji devi, sürüm için herhangi bir duyuru yapmadı ve bunun yerine modeli sessizce kullanıcılara yayınladı. Ayrıca, görüntü üretim modelinin işleyişini ayrıntılarıyla anlatan bir araştırma makalesi de çevrimiçi bir dergide yayınlandı. Şu anda, metinden görüntüye üretim modeli yalnızca ABD’deki kullanıcılar için kullanılabilir ve diğer bölgelerdeki kullanıcılara ne zaman sunulabileceğine dair bir açıklama yok.
Imagen 3 AI Modeli Google Tarafından Yayımlandı
Teknoloji devinin AI Test Kitchen’ı artık kullanıcıların kaydolmasına izin veriyor platform ve AI modelini kullanarak görseller üretiyor. Imagen modelinin üçüncü neslinin, geliştirilmiş doku üretimi ve kelime tanıma yeteneklerinin yanı sıra daha katı istem uyumluluğuna sahip olacağı söyleniyor.
AI modeli yalnızca ABD’de mevcut olduğundan, Gadgets 360 platformu test edemedi. Ancak, bir Reddit kullanıcısı iddia edildi Nikon DSLR kalitesi, GoPro stili, geniş açılı lens ve daha fazlası gibi çeşitli stillerde görüntüler üretebildiğini söyledi. Ancak, modelin selefiyle mümkün olan birden fazla kişiyle yakın çekim görüntüleri ve az aydınlatılmış görüntüler üretmede zorluk çektiği söyleniyor.
Imagen 3’ün mücadele ettiği bir diğer alan da uzuvlar. Kullanıcı, modelin “bir fincan kahve tutan adam” gibi komutları kullanırken hatalı sonuçlar ürettiğini iddia etti. Yapay zeka, ekstra uzuvlar üreterek, nesneyi tutan rastgele bir uzuv oluşturarak veya nesneyi ve uzvu birleştirerek sonuçlanıyordu. Görüntü oluşturma modelinin komutlarda çok katı bir sansür uyguladığı da söyleniyor.
Google da bir araştırma yayınladı kağıt ön baskı çevrimiçi dergisi arXiv’de. Şirket, burada Stable Diffusion tarafından popülerleştirilen difüzyon modelinin bir çeşidi olan gizli bir difüzyon modeli kullandığını vurguladı. Şirket ayrıca Imagen 3 modeli kullanılarak potansiyel zararı en aza indirmek için yeni yöntemler kullanıldığını ekledi.
Özellikle, Gemini chatbot’unun ücretsiz katmanı da görüntü üretebilir, ancak bunun için Gemini’nin yeteneklerini kullanır. Imagen 3 farklı bir mimari üzerine inşa edilmiştir ve veri kümesi büyük ölçüde görüntü içerdiğinden, AI görüntüleri üretmek için daha iyi eğitilmiştir.
En son teknoloji haberleri ve incelemeleri için Gadgets 360’ı takip edin X, Facebook, WhatsApp, Konular Ve Google HaberlerGadget’lar ve teknolojiyle ilgili en son videolar için abone olun YouTube kanalıEn iyi etkileyiciler hakkında her şeyi bilmek istiyorsanız, şirket içi takip edin KimBu360 Açık Instagram Ve YouTube.
Huawei’nin Üç Katlı Akıllı Telefonunun Benzersiz Tasarımını Sergilediği Bildirildi
IMF, Kripto Endüstrisinin Karbon Ayak İzinin Arttığını Söyledi; Yetkililer Emisyonları Azaltmak İçin Vergi Artışını Düşünüyor