OpenAI’nin, müşterilerin dikkat çekici derecede güçlü AI metinden görüntüye sistemi olan DALL-E 2 tarafından oluşturulan görüntüleri ticari olarak kullanmalarına izin vermeye başlamasından bu yana sadece birkaç hafta geçti. Ancak mevcut teknik sınırlamalara ve toplu lisanslama eksikliğine ve API’den bahsetmeye rağmen, bazı öncüler sistemi çeşitli iş kullanım durumları için zaten test ettiklerini söylüyorlar – DALL-E 2’nin üretime dağıtılacak kadar kararlı hale geleceği günü bekliyorlar. .

Giysileri kişiselleştirmek için öneri algoritmalarını kullanan çevrimiçi hizmet Stitch Fix, denenmiş DALL-2 ile ürünlerini renk, kumaş ve stil gibi belirli özelliklere göre görselleştirmek için. Örneğin, bir Stitch Fix müşterisi pilot uygulama sırasında “yüksek belli, kırmızı, esnek, skinny jean” isterse, bu öğenin görüntülerini oluşturmak için DALL-E 2’ye dokunuldu ve bir stilistin benzer bir pantolonla eşleştirmek için kullanabileceği Stitch Fix’in envanterindeki ürün.

Bir sözcü TechCrunch’a e-posta yoluyla “DALL-E 2, bir ürünün en bilgilendirici özelliklerini görsel bir şekilde ortaya çıkarmamıza yardımcı oluyor ve sonuçta stilistlerin bir müşterinin yazılı geri bildirimlerinde talep ettiği şeyle eşleşen mükemmel öğeyi bulmalarına yardımcı oluyor” dedi.

Dikiş Düzeltme DALL-E 2

Stitch Fix’in pilot uygulamasından bir DALL-E 2 nesli. Soru şuydu: “yumuşak, zeytin yeşili, harika renk, cepler, desenli, sevimli doku, uzun, hırka.”

Elbette, DALL-E 2’de bazı tuhaflıklar var – bunların bazıları erken kurumsal kullanıcılara duraklama veriyor. E-ticaret girişimi Klaviyo’da veri bilimi başkan yardımcısı Eric Silberstein, şunları özetliyor: Blog yazısı potansiyel bir pazarlama aracı olarak sistem hakkındaki karışık izlenimleri.

DALL-E 2 tarafından oluşturulan insan modellerinde yüz ifadelerinin uygunsuz olma eğiliminde olduğunu ve kaslar ile eklemlerin orantısız olduğunu ve sistemin talimatları her zaman tam olarak anlamadığını belirtiyor. Silberstein, DALL-E 2’den gri bir arka plana karşı ahşap bir masa üzerinde bir mum görüntüsü oluşturmasını istediğinde, DALL-E 2 bazen mumun kapağını silip masaya karıştırdı veya mumun etrafına uyumsuz bir çerçeve ekledi.

DALL-E 2 Eric Silberstein

Silberstein’ın ürün görselleştirmesi için DALL-E 2 ile yaptığı deneyler.

Silberstein, “İnsanlı fotoğraflar ve insan modelleme ürünleri fotoğrafları için olduğu gibi kullanılamaz” diye yazdı. Yine de, düzenlemeler için başlangıç ​​noktaları vermek ve grafik sanatçılarına fikir aktarmak gibi görevler için DALL-E 2’yi kullanmayı düşüneceğini söyledi. Silberstein, “Uzman olmayan gözüme göre, insan içermeyen stok fotoğraflar ve belirli markalama yönergeleri olmayan illüstrasyonlar için DALL·E 2, şu anda makul bir şekilde ‘eski yöntemin’ yerini alabilir,” diye devam etti Silberstein.

Cosmopolitan’daki editörler benzer bir sonuca vardılar. çözüm DALL-E 2 kullanarak dergi için bir kapak oluşturmak üzere dijital sanatçı Karen X. Cheng ile bir araya geldiklerinde. bir sanat üreteci olarak DALL-E 2’nin sınırlamasının açıklayıcısı.

Ancak AI tuhaflığı bazen işe yarar – bir hatadan ziyade bir özellik olarak. Onun Draw Ketçap için kampanya, Heinz, DALL-E 2’ye “ketçap”, “ketçap sanatı”, “bulanık ketçap”, “uzayda ketçap” ve “”ketçap rönesansı” gibi doğal dil terimlerini kullanarak bir dizi ketçap şişesi görüntüsü oluşturdu. Şirket, hayranlarını Heinz’in küratörlüğünü yaptığı ve sosyal kanallarında paylaştığı kendi istemlerini göndermeye davet etti.

Heinz DALL-E 2

Heinz’in son reklam kampanyasının bir parçası olan DALL-E 2’nin “hayal ettiği” Heinz şişeleri.

“Haberlere ve sosyal beslemelere hakim olan AI görüntüleri ile, ‘Ketchup Çek’ kampanyamızı genişletmek için doğal bir fırsat gördük; Heinz’in kıdemli marka müdürü Jacqueline Chao, bir basın açıklamasında, “Bu teoriyi AI alanında test etmek için Heinz’in ketçap kelimesiyle eşanlamlı olduğu anlayışına dayanıyor” dedi.

Açıkçası, DALL-E 2 odaklı kampanyalar, söz konusu yapay zeka olduğunda işe yarayabilir. Ancak birkaç DALL-E 2 iş kullanıcısı, yapay zeka kısıtlamalarının belirgin işaretlerini taşımayan varlıklar oluşturmak için sistemi kullandıklarını söylüyor.

Bir yazılım mühendisi olan Jacob Martin, bir logo oluşturmak için DALL-E 2’yi kullandı. OctoSQL, geliştirdiği açık kaynaklı bir proje. Yaklaşık 30 $ – kabaca maliyeti Fiverr’da logo tasarım hizmetleri – Martin, çıplak gözle insan tarafından resmedilen bir ahtapotun çizgi film görüntüsüyle sonuçlandı.

Martin, “Sonuç ideal değil, ama bundan çok mutluyum” diye yazdı. Blog yazısı. “DALL-E 2’ye gelince, bence şu anda çoğu parça ve amaç için hala “birinci yineleme” aşamasında – ana istisna kurşun kalem eskizleri; bunlar akıllara durgunluk verecek kadar iyi… Bence asıl atılım, DALL-E 2 10x-100x daha ucuza ve daha hızlı hale geldiğinde gelecek.”

DALL-E 2 OctoSQL

DALL-E 2 ile birkaç denemeden sonra oluşturulan OctoSQL logosu.

Bir DALL-E 2 kullanıcısı – Deephaven’ın geliştirici başlangıcında tasarım başkanı olan Don McKenzie – fikri bir adım daha ileri götürdü. Şirketin blogunda küçük resimler oluşturmak için sistemi uygulamayı test etti. fikir resimli gönderiler, içermeyenlere göre çok daha fazla etkileşim alıyor.

McKenzie bir blog yazısında, “Çoğunlukla mühendislerden oluşan küçük bir ekip olarak, blog yazılarımızın her biri için özel sanat çalışmaları yaptıracak zamanımız veya bütçemiz yok” diye yazdı. “Şimdiye kadarki yaklaşımımız, stok fotoğraf sitelerinden teğetsel olarak ilişkili ancak nihayetinde uygun olmayan görüntüler arasında gezinmek, korkunç olmayan bir şey indirmek, ön konuya tokatlamak ve yayınlamak için 10 dakika harcamak oldu.”

McKenzie, bir hafta sonu ve 45 dolarlık kredi geçirdikten sonra, 100 kadar blog gönderisini DALL-E 2 tarafından oluşturulan görüntülerle değiştirebildiğini söylüyor. En iyi sonuçları almak için komutlarla uğraşmak gerekti, ancak McKenzie bu çabaya değdiğini söylüyor.

“Ortalama olarak, mutlu olduğum bir şeyi elde etmenin birkaç dakika ve blog yazısı başına yaklaşık dört ila beş istem aldığını söyleyebilirim” diye yazdı. “Daha kötü bir sonuçla, stok görüntülere ayda daha fazla para ve zaman harcıyorduk.”

Beyin fırtınası istemleri için harcayacak zamanı olmayan şirketler için, DALL-E 2’nin varlık oluşturma yeteneklerini ticarileştirmeye çalışan bir başlangıç ​​zaten var. Unstock.aiDALL-E 2’nin üzerine inşa edilen , şu anda ücretsiz olarak “isteğe bağlı olarak yüksek kaliteli görüntüler ve illüstrasyonlar” vaat ediyor. Müşteriler bir komut istemi girer (örneğin, “Bir kasede üç Japon balığının üstten görünümü”) ve ardından kırpılabilen ve yeniden boyutlandırılabilen görüntüler oluşturmak için tercih edilen bir stil (vektör sanatı, fotogerçekçi, kurşun kalemle çizilmiş) seçer.

Unstock.ai, metinde bir görev açıklamasını gömmek için görünen bir AI konsepti olan hızlı mühendisliği esasen otomatikleştirir. Buradaki fikir, kendisinden istenen şeyi güvenilir bir şekilde yerine getirmesi için bir AI sistemine ayrıntılı talimatlar sağlamaktır; genel olarak, “Kahve içen, işe yürüyen bir kadının filmi, telefoto” gibi bir istemin sonuçları “Yürüyen bir kadın”dan çok daha tutarlı olacaktır.

Muhtemelen gelecek uygulamaların habercisidir. Yorum için iletişime geçildiğinde, OpenAI, DALL-E 2’nin iş kullanıcıları ile ilgili sayıları paylaşmayı reddetti. Ancak anekdot olarak, talep orada görünüyor. DALL-E 2’nin API eksikliğine yönelik resmi olmayan geçici çözümler, sistemi uygulamalara, hizmetlere, web sitelerine ve hatta web sitelerine kurmaya hevesli geliştiriciler tarafından bir araya getirilerek web’de ortaya çıktı. video oyunları.



genel-24