Geçtiğimiz birkaç yılda, Midjourney ve OpenAI’nin DALL-E’si gibi programlar tarafından yapılan sanat şaşırtıcı bir şekilde ilgi çekici hale geldi. Bu programlar, bir metin istemini kelimenin tam anlamıyla (ve tartışmalı olarak) ödüllü sanata çevirebilir. Araçlar daha karmaşık hale geldikçe, bu istemler kendi başlarına bir zanaat haline geldi. Ve diğer tüm zanaatlarda olduğu gibi, bazı yaratıcılar onları satışa sunmaya başladı.
PromptBase, bir tür meta-sanat pazarı olan görüntü oluşturuculardan belirli görüntüler oluşturmaya yönelik istemlerdeki yeni ticaretin merkezinde yer alıyor. Bu yaz başlarında başlatılan hem entrika hem eleştiri, platform “hızlı mühendislerin” belirli bir yapay zeka platformunda belirli bir sanat stilini veya konusunu güvenilir bir şekilde üreten metin açıklamaları satmasına olanak tanır. İstemi satın aldığınızda, Midjourney, DALL-E veya erişiminiz olan başka bir sisteme yapıştırdığınız bir dizi sözcük alırsınız. Sonuç (eğer iyi bir bilgi istemiyse), aşağıdaki gibi görsel bir temanın bir varyasyonudur. tırnak sanat tasarımları, anime pinuplarıveya “fütüristik sulu meyveler.”
Bilgi istemleri, birkaç açıklama kelimesinden daha karmaşıktır. Amaçlanan estetiği açıklayan anahtar kelimeleri, bir sahnenin önemli unsurlarını ve alıcıların içeriği uyarlamak için kendi değişkenlerini ekleyebilecekleri parantezleri içerir. Tırnak tasarımı gibi bir şey, ellerin pozisyonlarını, sahte fotoğraf çekiminin açısını ve farklı manikür stilleri ve temaları üretmek için komut isteminde ince ayar yapma talimatlarını içerebilir. PromptBase yüzde 20 komisyon alıyor ve yazarlar çalışmalarının sahipliğini koruyor – AI sanatının ve istemlerin telif hakkı durumu büyük ölçüde test edilmemiş sular olsa da.
Bir metin paragrafı için 2 ila 5 dolar ödemek garip bir satın alma gibi görünebilir ve ücretli bilgi istemleri fikri doğru oturmuyor bu sistemleri kullanan herkesle. Ancak yukarıda bahsedilen tırnak tasarımı tasarımını satın aldıktan sonra, iyi bir ticari yapay zeka istemi yapmak için ne gerektiğini ve aslında içinde ne kadar para olduğunu merak ettim. PromptBase, bu konuda konuşmam için tasarımcı Justin Reckling ile temasa geçmemi sağladı.
Aşağıdakiler, netlik için sıkıştırılmış ve hafifçe düzenlenmiştir.
Hızlı mühendisliğe nasıl ve ne zaman girdiniz? Sizi bu konuda iyi yapan belirli becerileriniz var mıydı?
2022 Nisan’ında OpenAI’nin GPT-3 metin oluşturma aracını elime aldığımda hızlı mühendisliğe başladım. Hızlı bir şekilde bu konuda bir yeteneğim olduğunu ve onunla harika metinden görüntüye istemler oluşturabildiğimi fark ettim. İlgili becerilerim programlama ve yazılım kalite güvencesini içerir. Ayrıca, görsel olarak çekici istemler oluşturmama yardımcı olan estetik konusunda iyi bir gözüm var.
Öncelikle bir sanatçı olma, kodlayıcı veya mühendis olma veya başka bir şey olma perspektifinden hızlı bir şekilde yazmaya mı başlıyorsunuz?
Bir sanatçı, kodlayıcı ve mühendis perspektifinden hızlı yazmayı görüyorum. Programlama deneyimimi, hizmetin istemimi nasıl yorumlayabileceğini anlamama yardımcı olması için kullanıyorum, bu da beni, peşinde olduğum sonuçları ikna etmek için onunla daha etkili bir şekilde uğraşmaya yönlendiriyor. Bir bilgi istemindeki her kelimenin kendisiyle ilişkili bir ağırlığı vardır, bu nedenle neyin en iyi sonucu verdiğini ve nerede beceri setinde temel bir varlık haline geldiğini bulmaya çalışmak. Yazılım kalite güvencesi konusundaki geçmişim, “eğer olursa” düşünce tarzında oldukça büyük bir itici güçtür. Büyürken aşırı derecede ayrıntılı olmak da kılık değiştirmiş bir tür nimet olmuştur. Şimdi buna sahip olmak çok özgürleştirici hissettiriyor.
Tipik bir günde/haftada kaç bilgi istemi satıyorsunuz? İnsanların onları ne için satın aldığına dair bir fikriniz var mı?
Genellikle günde üç ila beş bilgi istemi satıyorum ve her bir istem bir veya iki ay içinde ortalama iki ila üç satış yapıyor. Şu anda 50 bilgi isteminden oluşan bir envanterim var ve düzenli olarak yenileri ekleniyor. Satılan istemlerin çoğu, ticari amaçlardan ziyade zevk için görünüyor.
Ne yapıp satacağınıza nasıl karar veriyorsunuz? Daha çok kişisel çıkarlarınıza mı yoksa toplumdaki talebinize mi dayanıyor?
Hem kişisel çıkarların hem de topluluktan gelen talebin bir karışımı. İnsanların faydalı ve ilham verici bulacağı şeyler yapmak istiyorum ve bu iki şey örtüştüğünde harika oluyor. Ayrıca, topluluğun ihtiyaçlarını anlayabilmek ve aradıklarını sağlamaya devam edebilmek için neyin iyi satıldığına da göz kulak olmam gerekiyor. Ana sayfada “en popüler istemler” atlıkarınca listesini kullanıyorum. Yakında satıcıya özel bazı metrikleri elde edeceğiz.
En popüler isteminiz nedir?
Blok Şehirler en çok satışı var. En yüksek görüntülemeler ve satın almalar istemi benimki olmalı T-Shirt Ürün Çekimleri.
Bir bilgi istemi oluşturmaya nasıl başlarsınız?
Neyi başarmak istediğime dair kabaca bir fikre sahip olduktan sonra, işleri insanlara, yerlere ve şeylere – oluşturmaya çalıştığım sahnedeki ana aktörlere veya ana itici güçlere – indirmeye çalışırım. Hizmeti, sahnenin nasıl görünebileceğine dair bir fikir edinmek için birkaç kaba komut oluşturmak için kullanıyorum. Geri dönüp daha iyi görünene kadar bir şeyleri kaldırmak zorunda kalmak yerine, iyi çalışan bir şeyi alıp üzerine eklemeyi çok daha kolay buluyorum. Büyük önemli vuruşlarla başlarsınız ve daha sonra daha ince ayrıntılarla çalışırsınız.
Üretmeye çalıştığınız şey hakkında ne kadar araştırma yapıyorsunuz? Örneğin, tırnak sanatı yapıyorsanız, tırnak terminolojisi ve tercih edilen el pozları gibi şeyleri öğrenmeniz mi gerekiyor yoksa sezgiyle mi gidiyorsunuz?
Oluşturduğum her metinden görüntüye bilgi istemi için oldukça fazla araştırma yapıyorum. Yaratmaya çalıştığım sahneyi daha iyi anlamama yardımcı olması için GPT-3 konularıyla ilgili sorular sorarak başlıyorum. Örneğin, birinin manikür yaptırması hakkında bir bilgi istemi oluşturuyorsam, “Birisi manikür yaptırıyor; ne gördüğünü açıkla.” Bu, makalelere veya o kadar doğru olmayabilecek diğer bilgi kaynaklarına güvenmek yerine bir uzmandan daha spesifik ayrıntılar almamı sağlıyor.
Çalışırken öğrendiğiniz ve yönlendirmeyi kolaylaştıran belirli beceriler veya püf noktaları var mı?
Metinden görüntüye istemler oluştururken, ana fikirleri ayırmak için alıntılar kullanmak yararlı olabilir. Ek olarak, “hiper gerçekçi”, “makro fotoğrafçılık”, “oktan işleme”, “hiper ayrıntılı”, “sinematik aydınlatma”, “uzun çekim”, “orta çekim” gibi terimlere aşina olmak yardımcı olabilir. vb. Bu size komutlarınıza nasıl derinlik ve ayrıntı ekleyeceğinizi daha iyi anlamanızı sağlayacak ve ayrıca mesafeyi ve odağı kontrol etmenize yardımcı olacaktır. Örneğin, daha rafine ve spesifik bir görüntü oluşturmak için yukarıdaki istemin sonuna “sinematik aydınlatma” ve “altın saat” ifadelerini ekleyebilirsiniz.
Görsel çalışmalarınız çoğunlukla DALL-E tabanlı görünüyor, ancak Midjourney gibi diğer sistemler için hızlı yapım süreci ne kadar farklı?
Gerçekten ne aradığınıza ve ne yapmanız gerektiğine bağlı. Stok görsel ikamesi gibi daha gösterişli ve profesyonel bir şey istiyorsanız, muhtemelen en iyi seçeneğiniz DALL-E’dir. Ancak, daha yaratıcı ve uygulamalı bir şey arıyorsanız Midjourney daha iyi bir seçenek olabilir. Midjourney ile kelimelerin ağırlıklarını ayarlayabilir, hangi çözünürlükte istediğinize karar verebilir ve diğer özelleştirmeleri yapabilirsiniz. Ancak, istediğiniz sonuçları elde etmenin daha fazla zaman ve çaba gerektirdiğini unutmayın.
Kelimelerin ağırlığını ayarlamak ne işe yarar?
Ağırlığı artırmak, o kelimenin “tatının” gücünü arttırır, bu nedenle daha belirgin bir şekilde tezahür etme şansı daha yüksektir. Tersine, ağırlıkları gerektiği kadar azaltabilirsiniz. Bunu iki nokta üst üste ve bir sayı ekleyerek yaparsınız. Her kelimenin 1 ağırlığı vardır, “sosisli sandviç::1.5” köpeğin ağırlığını 1,5 kat arttırır, 0,5 bunu yarıya indirir.
Yani “köpek”in ağırlığını azaltmak, gerçek bir köpek yerine mamayı alma ihtimalinizi mi artıracak?
Bu doğru ve onu arttırmak size çok çekici bir köpek ya da bir bardak su arayan bir köpek verebilir.
Bir yandan not olarak, Midjourney’den biraz zevk alıyorum. İstemlerimin çoğunun Midjourney tabanlı olacağını düşünürdüm, ancak yakın zamana kadar PromptBase tarafından yalnızca DALL-E istemleri kabul edildi, bu yüzden çabamın çoğunu orada harcadım.
Ayrıca, bilgisayarınızda yerel olarak çalıştırabileceğiniz Stable Diffusion adlı bir metinden görüntüye oluşturucu olduğunu da belirtmekte fayda var. Ancak, modeli çalıştırmak için oldukça güçlü bir ekran kartına ihtiyacınız var, bu yüzden olabileceği kadar geniş çapta erişilebilir değil. Uzun vadede, kısıtlamalardan arınmış yerel olarak işletilen modellerin eninde sonunda pazardaki büyük oyuncuları geçeceğine inanıyorum. Son zamanlarda bunu epeyce deneyimledim.
Çok fazla para harcamak zorunda kalmadan komutlarınızı kurcalama yeteneği benim için büyük bir çekiliş. Şu anda, istediğim sonuçları elde etmek için oluşturduğum her istem için 10 ila 15 ABD Doları kredi harcamam gerekiyor.
Bunu daha önceki rakamlarla karşılaştırırsak, her istem için satışta yaptığınızdan daha fazlasını harcıyorsunuz gibi görünüyor.
Evet, başabaş olması için belirli bir istemin yaklaşık 5 ila 10’unu satmam gerekiyor. Bazılarının oluşturulması uzun sürmüyor ve istemler arasında yeniden kullanmak için metin bulma konusunda daha iyi hale geldikçe, nihai hedefime ulaşmak için daha az varyasyona ihtiyacım olacak. Kullanım durumlarına olan ilgi artmaya devam ettiğinden, bu teknolojiye yatırım yapmak uzun vadede faydalıdır. Ayrıca diğer modellere uygulayabileceğim beceriler de öğreniyorum, bu yüzden şu anda bunun bir dezavantaj olduğunu düşünmüyorum.
Bu aynı zamanda istemlerin değerine biraz ışık tutar. Dışarıda yaptığım şeyi eleştiren birçok insan var, ama çoğu zaman sadece sonucu görüyorlar ve o nihai hedefe ulaşmak için hiçbir çaba göstermiyorlar. Onlar için sonradan anlaşılan bir şey. Tabii ki, herkes bu kelimeleri yazabilir, ancak ilk istemde manikürlü elleri tutarlı bir pozla nasıl elde edeceğinizi bulabilir misiniz? İstemlerin istisnai sonuçlarının tutarlılığı da büyük bir değer kaynağıdır.
Bu keşfin parasal maliyeti düşse bile, her zaman değerli olacak olan bu istemdeki son kelimelere belirli bir zaman ve çaba harcandı.
İşinizin mülkiyeti hakkında nasıl düşünüyorsunuz? Taleplerinizin telif hakkıyla korunup korunmadığına dair bir fikriniz var mı ve bunu ne kadar umursuyorsunuz?
İşimin sahipliğini çok fazla düşünmüyorum – sadece gurur duyduğum ve başkalarının keyif alacağı bir şey yaratmaya çalışıyorum. Telif hakkı korumalarına gelince, çalışmamı ifşa ettiğim için para aldığım için bu konuda çok endişelenmiyorum. Bence toplumumuz, yaratıcı alanda finansal olarak mücadele edebilecek olanlara yardım etmek için evrensel temel gelir gibi sosyal güvenlik ağları sağlamalı. Otomasyon farklı meslekleri etkilemeye devam ettikçe bu giderek daha önemli hale gelecektir.
Senin de bazı GPT-3 metin istemleri yaptığını gördüm. AI sanat istemlerini otomatik olarak oluşturacak bir AI metin istemi yazabilir misiniz?
OpenAI’de eğitimli bir modelim var ve bana şu adreste paylaşma izni verildi: typestitch.com. Gerçek dünyadaki komutlardan elde edilen oldukça fazla veri üzerinde eğitilmiştir, bu nedenle bir veya iki anahtar kelime alabilir ve eğlenmek için denemeniz için örnek istemler oluşturabilir veya sadece size kafa yormanız için bazı konsept fikirler verebilir.
Modeli her gün yaratıcılığımı harekete geçirmeme yardımcı olması için ya da günün sonunda arkadaşlarımla paylaşmak için rastgele bir çılgınlık yaratmak için kullanıyorum. Olduğu gibi oluşturulmuş bir bilgi istemini satmaktan asla vazgeçmedim. Seyircinin ihtiyaçları, kapıdan hemen sonra güvenilir bir şekilde olumlu bir istemi oluşturmak için hala çok nüanslıdır. Ancak yeterli örnekle, bir model size oynamanın keyfini çıkarabileceğiniz birçok yeni ve tuhaf fikir verebilir.