Geçen hafta Meta sessizce yeni bir bağımsız yapay zeka görüntü oluşturucu ürününü piyasaya sürdü. Diğer AI araçlarının aksine bu, Meta markası altında piyasaya sürüldü.
Meta ile hayal edin Kullanımı ücretsizdir ancak görsellerin hatalı veya uygunsuz olabileceği uyarısını da beraberinde getirir. Ayrıca şu anda yalnızca ABD’de mevcuttur
Bu yeni ürünle Meta, yapay zeka araştırmalarındaki uzun geçmişini sergiliyor, uzaydaki en güçlü ve önemli araçlardan bazılarını geliştirip açık kaynak haline getiriyor. Aynı zamanda Midjourney, Stable Diffusion ve OpenAI gibi büyük oyuncularla da rekabet ediyor.
Imagine, WhatsApp, Instagram ve Facebook’ta görüntü oluşturma yeteneklerini güçlendiren temel modeldir. Ayrıca, Messenger grup sohbetlerindeki katılımcıların üretken bir yapay zeka görüntüsü üzerinde birlikte çalışmasına olanak tanıyan yeni yeniden tasarlama özelliğini de güçlendiriyor.
Imagine’in çalışma şekli ile ChatGPT’deki DALL-E 3 veya StabilityAI’nin SDXL 1.0’ı gibi araçlar arasındaki en büyük fark, ayrıntı düzeyindedir. Eski AI modellerinin aksine, Imagine size çıktının bazı yönleri üzerinde ince ayar veya kontrol sunmaz.
Modelin oluşturmasını istediğiniz görüntüyü tanımlamak için yalnızca tek bir metin istemine sahipsiniz. Belirli bir tarzda bir görüntü oluşturmasını sağlamak gibi değişkenleri ayarlayabilirsiniz ancak oluşturduğu görüntülerin boyutunu, çözünürlüğünü veya sayısını değiştiremezsiniz.
Size isteminizden dört seçenek sunar ve hepsi 1280×1280 çözünürlüklü kare formattadır (DALL-E 3’ten biraz daha büyüktür) ve hepsi bir Meta filigranı ile birlikte gelir.
Etkileyici hız
Imagine with Meta ile diğer görüntü oluşturucular arasındaki en dikkate değer farklardan biri hızıdır. Görüntüleri neredeyse anında oluşturdu ve görüntülerini oluşturmak, yakın zamanda test ettiğim StabilityAI’nin hızlı geri dönüşlü canlı görüntü oluşturucusu SDXL Turbo kadar uzun sürdü.
Bu hızlı nesil, nispeten yeni olmasından ve büyük oyuncular kadar yaygın kullanılmamasından kaynaklanıyor olabilir. Bunun nedeni Meta’nın geniş ölçekte yapay zeka sunmaya odaklanması da olabilir.
Imagine with Meta’yı denemek için ilham almak üzere ChatGPT’ye başvurdum. OpenAI’nin sohbet robotunun premium sürümünden, görüntü oluşturucuyu adım adım ilerletecek ve tüm yeteneklerini test edecek bir dizi istem oluşturmasını istedim.
Bilgi istemleri, çeşitli ve karmaşık sahnelerin, sanatsal tarzların, karmaşık anlatı öğelerinin, fütüristik ve fantastik ortamların ve ayrıntılı bir logo ve marka konseptinin oluşturulmasını kapsıyordu.
Viktorya Dönemi Steampunk
İlk olarak bir şehir manzarası, özellikle steampunk esintili bir Viktorya dönemi şehri vardı. Pirinç ve bakırdan yapılmış süslü binalarla ve mekanik donanımlarla Viktorya dönemi kıyafetleri giyen insanlarla doldurulması gerekiyordu.
Çekici ve merak uyandırıcı bir imaj yarattı ancak steampunk’ın brifingini tam anlamıyla yerine getirmedi. Daha çok boş bir yol ve dükkanlarla tipik bir İngiliz Viktorya dönemi sokak sahnesine benziyor.
Sualtı uzaylıları
Daha sonra, biyolüminesanslı bitkileri ve yaratıkları cesur renklerle tasvir etmesini gerektiren yabancı bir gezegenin su altı dünyasını hayal edin. Aynı zamanda Dünya’da bariz olmayan yaşam çeşitliliğini de göz önünde bulundurması ve gölgelerle oynaması gerekiyordu.
İstemin uhrevi doğasını yakalama konusunda gerçekten iyi bir iş çıkardı. Panayır alanında parlayan bir şehir ile ön planda doğal bir manzarayı tasvir ediyordu. Tek sorun, tüm sahnenin derin su altında olması gerekirken gece gökyüzündeki yıldızları tasvir etmesiydi.
Geleceğe doğru
Bir sonraki istem için Mars’a doğru yola çıktık. Spesifik olarak, kızıl gezegenin çöl manzarasını da içeren kubbeli yaşam alanlarına sahip gelecekteki bir Mars kolonisi. Bunun biraz komik olduğunu hissettim ama fotogerçekçi bir görüntü yaratması söylenmedi.
En büyük sorun, bir gezegenin görüntüleri oluşturulurken tüm görüntü oluşturucuların paylaştığı bir sorundu; bu, gezegenin tuhaf versiyonlarını yüzeye koyuyor ve gökyüzünde rastgele aylar oluşturuyordu.
Alacakaranlıkta efsanevi orman
Son fotografik görüntü üretimi, alacakaranlıkta efsanevi bir ormana aitti. Bu, farklı seviyelerde aydınlatma oluşturmak için Imagine with Meta’yı gerektiriyordu. Kadim ve devasa ağaçları, ışıldayan mantarlarla dolu bir orman zeminini ve periler ve periler gibi ruhani yaratıkları göstermesi gerekiyordu.
Bunun su altı uzaylıları görüntüsüyle bazı benzerlikleri vardı. Ağaçları, mantarlara odaklanarak daha çok bir arka plan özelliği olarak tasvir etti. Periler ve periler yerine, efsanevi yaratık olarak tek boynuzlu atı seçti.
Bir metin mücadelesi
Son olarak Imagine with Meta’dan Sepetteki Kedi adlı kurgusal iplik satışı işi için bir logo oluşturmasını istedim. Buradaki zorluk, logoyu nasıl yorumladığını ve aynı zamanda görsel içinde metni ne kadar iyi ürettiğini görmekti. Genel modeller arasında yalnızca DALL-E 3 bunu iyi bir şekilde başarıyor.
Eğlenceli bir logo oluşturdu ancak metni SDXL 1.0, Midjourney veya OpenAI’nin DALL-E’sinin önceki sürümü kadar iyi işledi – hiç de iyi değil. Sanki eski bir İngiliz lehçesinde yazıyormuş gibi “A Catt ia ana Batkett” yazarak kelimeleri çarpıtıyordu. Ama logo çok tatlıydı.