Yapay zeka girişimi Black Forest Labs tarafından geçtiğimiz haftalarda piyasaya sürülen Flux, türünün en güçlü ve popüler araçlarından biri haline geldi ve hatta pazar lideri Midjourney’e bile rakip oldu.
Sadece Midjourney’den erişilebilen kapalı ve ücretli bir servis olan Midjourney’den farklı olarak Flux, yerel olarak veya Freepik, NightCafe ve Hugging Face gibi çeşitli platformlarda indirilip çalıştırılabilen açık kaynaklı bir modeldir.
Flux’un Midjourney fotogerçekçilik ve doğru insan tasviri seviyelerine ulaşıp ulaşmadığını belirlemek için 5 tane betimleyici istem oluşturdum ve bunları her ikisinde de çalıştırdım. Pinokio AI yükleyicisi aracılığıyla yüklenen ComfyUI’yi kullanarak Flux görüntüleri oluşturuyorum.
İstemleri oluşturma
Hem Midjourney hem de Flux tanımlayıcı bir istemden faydalanır. Modelden tam olarak istediğinizi elde etmek için sadece kişiyi değil aynı zamanda stili, aydınlatmayı ve yapıyı da tanımlamak iyidir.
Aşağıda her bir komutu kendiniz deneyebilmeniz için ekledim ve bunlar Midjourney veya Flux’ınız yoksa Ideogram, ChatGPT’deki DALL-E 3 veya diğer AI görüntü platformlarıyla da çalışmalıdır, ancak Ideogram dışında hiçbiri Midjourney veya Flux’ın gerçekçiliğine ulaşamıyor.
1. Mutfakta bir şef
İlk test, karmaşık bir cilt dokusu oluşturma ihtiyacını dinamik bir ortamla, yani profesyonel bir mutfakla birleştirir. Komut, 50’li yaşların ortasındaki bir kadının yemek hazırlamasını ister.
Ayrıca arka planda yardımcı şeflerin tasvir edilmesi ve şefin isminin “tertemiz beyaz kruvaze şef ceketi” üzerinde gösterilmesi isteniyor.
A seasoned chef in her mid-50s is captured in action in a bustling professional kitchen. Her salt-and-pepper hair is neatly tucked under a crisp white chef's hat, with a few strands escaping around her temples. Her face, marked with laugh lines, shows intense concentration as she tastes a sauce from a wooden spoon. Her eyes, a warm brown, narrow slightly as she considers the flavor. The chef is wearing a spotless white double-breasted chef's jacket with her name embroidered in blue on the breast pocket. Black and white checkered pants and slip-resistant clogs complete her professional attire. A colorful array of sauce stains on her apron tells the story of a busy service. Behind her, the kitchen is a hive of activity. Stainless steel surfaces gleam under bright overhead lights, reflecting the controlled chaos of dinner service. Sous chefs in white jackets move purposefully between stations, and steam rises from pots on industrial stoves. Plates of artfully arranged dishes wait on the pass, ready for service. In the foreground, a marble countertop is visible, strewn with fresh herbs and exotic spices. A stack of well-worn cookbooks sits nearby, hinting at the chef's dedication to her craft and continuous learning. The overall scene captures the intensity, precision, and passion of high-end culinary artistry.
Kazanan: Yolculuğun ortasında
Midjourney ana karakterin gerçekçiliği için kazanıyor. Mükemmel değil ve Flux imgesinin dinamizmini tercih ediyorum ama zorluk doğru insanları yaratmak ve Midjourney daha iyi cilt dokusuyla daha yakın.
2. Sokak müzisyeni
Bir sonraki komut, her iki yapay zeka görüntü oluşturucusundan, müziğin ritmine kapılmış, kalabalık bir şehir köşesinde performans sergileyen 30’lu yaşlarının sonlarındaki bir sokak müzisyenini göstermesini istiyor.
İstemin bir kısmı, takdir eden bir yoldan geçen kişinin, gitar kutusundaki bozuk paraların ve ana karakterin arkasında hareket halinde bulanıklaşan şehir hayatının dahil edilmesini gerektiriyor.
A street musician in his late 30s is frozen in a moment of passionate performance on a busy city corner. His long, dark dreadlocks are caught mid-sway, some falling over his face while others dance in the air around him. His eyes are closed in deep concentration, brows slightly furrowed, as his weathered hands move deftly over the strings of an old, well-loved acoustic guitar. The musician is wearing a vibrant, hand-knitted sweater that's a patchwork of blues, greens, and purples. It hangs loosely over distressed jeans with artistic patches on the knees. On his feet are scuffed brown leather boots, tapping in rhythm with his music. Multiple colorful braided bracelets adorn his wrists, adding to his bohemian appearance. He stands on a gritty sidewalk, with a battered guitar case open at his feet. It's scattered with coins and bills from appreciative passersby, along with a few fallen autumn leaves. Behind him, city life unfolds in a blur of motion: pedestrians hurry past, yellow taxis honk in the congested street, and neon signs begin to flicker to life as dusk settles over the urban landscape. In the foreground, slightly out of focus, a child tugs on her mother's hand, trying to stop and listen to the music. The scene captures the raw energy and emotion of street performance against the backdrop of a bustling, indifferent city.
Kazanan: Yolculuğun ortasında
Midjourney karakterin gerçekçiliği açısından yine kazanıyor. v6.1’in doku kalitesi onu bir kez daha öne çıkarıyor. Ayrıca yapı, düzen ve arka plan açısından genel olarak daha iyi bir görüntü.
3. Bahçıvan
Daha karmaşık cilt dokusu nedeniyle, yaşlı insanların görüntülerini oluşturmak AI görüntü oluşturucuları için her zaman bir mücadele olabilir. Burada 80’li yaşlarında bir kadının çatı bahçesinde bitkilere bakmasını istiyoruz.
Resimde sahnenin öğeleri tasvir ediliyor; tırmanan sarmaşıklar ve bahçıvanımızın arkasında yükselen şehir silüetiyle birlikte altın rengi bir akşam ışığı.
An elderly woman in her early 80s is tenderly caring for plants in her rooftop garden, set against a backdrop of a crowded city. Her silver hair is tied back in a loose bun, with wispy strands escaping to frame her kind, deeply wrinkled face. Her blue eyes twinkle with contentment as she smiles at a ripe tomato cradled gently in her soil-stained gardening gloves. She's wearing a floral print dress in soft pastels, protected by a well-worn, earth-toned apron. Comfortable slip-on shoes and a wide-brimmed straw hat complete her gardening outfit. A pair of reading glasses hangs from a beaded chain around her neck, ready for when she needs to consult her gardening journal. The rooftop around her is transformed into a green oasis. Raised beds burst with a variety of vegetables and flowers, creating a colorful patchwork. Trellises covered in climbing vines stand tall, and terracotta pots filled with herbs line the edges. A small greenhouse is visible in one corner, its glass panels reflecting the golden evening light. In the background, the city skyline looms large - a forest of concrete and glass that stands in stark contrast to this vibrant garden. The setting sun casts a warm glow over the scene, highlighting the lush plants and the serenity on the woman's face as she finds peace in her urban Eden.
Kazanan: Yolculuğun ortasında
Midjourney bir kez daha doku kalitesi nedeniyle kazanıyor. Eldivenli parmaklarla biraz zorlandı ama Flux’tan daha iyiydi. Bu Flux’ın iyi bir görüntü olmadığı anlamına gelmiyor ama Midjourney kadar iyi değil.
4. Acil bir durumda sağlık görevlisi
Bu istem için daha aksiyon ağırlıklı bir şey seçtim, yağmurlu bir günde ambulansa yetişmeye çalışan bir sağlık görevlisine odaklandım. Bu, kirpiklere yapışan su damlacıklarının ve yansıtıcı şeritlerin bir açıklamasını içeriyordu.
Bu, yapay zeka görüntü oluşturucuları için daha zorlu bir görevdi çünkü daha karanlık ortamı yakalamak zorundaydı. ‘Altın saat’ ışığı, yapay zeka için gece ve alacakaranlıktan daha kolaydır.
A young paramedic in her mid-20s is captured in a moment of urgent action as she rushes out of an ambulance on a rainy night. Her short blonde hair is plastered to her forehead by the rain, and droplets cling to her eyelashes. Her blue eyes are sharp and focused, reflecting the flashing lights of the emergency vehicles. Her expression is one of determination and controlled urgency. She's wearing a dark blue uniform with reflective strips that catch the light, the jacket partially unzipped to reveal a light blue shirt underneath. A stethoscope hangs around her neck, bouncing slightly as she moves. Heavy-duty black boots splash through puddles, and a waterproof watch is visible on her wrist, its face illuminated for easy reading in the darkness. In her arms, she carries a large red medical bag, gripping it tightly as she navigates the wet pavement. Behind her, the ambulance looms large, its red and blue lights casting an eerie glow over the rain-slicked street. Her partner can be seen in the background, wheeling out a gurney from the back of the vehicle. In the foreground, blurred by the rain and motion, concerned onlookers gather under umbrellas near what appears to be a car accident scene just out of frame. The wet street reflects the emergency lights, creating a dramatic kaleidoscope of color against the dark night. The entire scene pulses with tension and the critical nature of the unfolding emergency.
Kazanan: Çizmek
Bu turda AI görüntü oluşturucularından hiçbirinin kazandığını düşünmüyorum. Her ikisinin de muhtemelen aydınlatma sorunlarından kaynaklanan soluk ve ‘plastik’ yüz dokuları var. Midjourney sahnenin tanımıyla eşleşmede biraz daha iyi bir iş çıkarıyor.
5. Emekli astronot
Son olarak bir okulda bir sahnemiz var. Burada AI modellerinden 60’lı yaşlarının sonlarında emekli bir astronotu uzay hakkında bir sunum yaparken oluşturmalarını istedim.
NASA logosunu tasvir eden iyi sağlıkta iyi bir şekilde sunulmuştur. Arka plan, posterler, alıntılar ve konuşurken onu izleyen insanlarla iyi bir şekilde tanımlanmıştır.
A retired astronaut in his late 60s is giving an animated presentation at a science museum. His silver hair is neatly trimmed, and despite his age, he stands tall and straight, a testament to years of rigorous physical training. His blue eyes sparkle with enthusiasm as he gestures towards a large scale model of the solar system suspended from the ceiling. He's dressed in a navy blue blazer with a small, subtle NASA pin on the lapel. Underneath, he wears a light blue button-up shirt and khaki slacks. On his left wrist is a watch that looks suspiciously like the ones worn on space missions. His hands, though showing signs of age, move with the precision and control of someone used to operating in zero gravity. Around him, a diverse group of students listen with rapt attention. Some furiously scribble notes, while others have their hands half-raised, eager to ask questions. The audience is a mix of ages and backgrounds, all united by their fascination with space exploration. The walls of the presentation space are adorned with large, high-resolution photographs of galaxies, nebulae, and planets. Inspirational quotes about exploration and discovery are interspersed between the images. In one corner, a genuine space suit stands in a glass case, adding authenticity to the presenter's words. Sunlight streams through large windows, illuminating particles of dust floating in the air, reminiscent of stars in the night sky. The entire scene is bathed in a sense of wonder and possibility, as the retired astronaut bridges the gap between Earth and the cosmos for his eager audience.
Kazanan: Flux
Bunu Flux’a veriyorum. Midjourney ile aynı seviyede veya biraz daha iyi bir cilt dokusu ve insan gerçekçiliği olduğu için kazandı ancak daha gerçekçi arka plan insanları da dahil olmak üzere çok daha iyi bir genel görüntü yapısı vardı.
Flux ve Midjourney: Hangi model kazanır?
Başlık Hücresi – Sütun 0 | Yolculuğun ortasında | Akış |
---|---|---|
Mutfakta bir şef | 🌅 | Satır 0 – Hücre 2 |
Bir sokak müzisyeni | 🌅 | Satır 1 – Hücre 2 |
Bahçıvan | 🌅 | Satır 2 – Hücre 2 |
Acil bir durumda sağlık görevlisi | 🌅 | 🌅 |
Emekli astronot | Satır 4 – Hücre 1 | 🌅 |
Bu, Midjourney için neredeyse tam bir zaferdi ve esas olarak Midjourney’in v6.1 ile cilt dokusu oluşturmada yaptığı iyileştirmelerden kaynaklanıyordu.
Kağıt üzerinde göründüğü kadar net olduğunu düşünmüyorum çünkü birçok görüntüde Flux daha iyi bir genel görüntü yapısına sahipti ve arka planlarda daha iyiydi. Ayrıca Flux’un metin oluşturmada Midjourney’den daha tutarlı olduğunu buldum — ancak bu test insanlarla ve gerçekçi dijital insanlar yaratmakla ilgiliydi.
Gösterdiği şey, yapay zeka görüntü üretiminin en ileri noktasında bile, her görüntüde onu yapay zeka tarafından üretilmiş gibi pazarlayacak ipuçlarının olduğudur.