Openai, Salı günü mevcut GPT-4O Yapay Zeka (AI) modeline görüntü oluşturma özelliği ekledi. San Francisco merkezli AI firması 4O görüntü oluşturma modelini yayınladı ve GPT-4O’ya entegre etti. Şirket, bu görüntü jeneratörünün odağının dekorasyon yerine kullanışlılık üzerinde olduğunu söyledi. Doğru metin oluşturma, yüksek hızlı uyum, karakter tutarlılığı ile birlikte gelir ve metin istemleri yoluyla görüntü düzenleme özelliği sunar. Openai ayrıca derin dişler riskini ve zararlı içerik üretimini azaltmak için birkaç adım attı.
Chatgpt gelişmiş görüntü oluşturma özelliği alır
Bu yeni eklemeden önce bile, Chatgpt Dall-E modellerinden biri tarafından desteklenen görüntüler üretebilir. Bununla birlikte, bu, karakter tutarlılığı ve metin üretiminin alt olduğu temel bir görüntü oluşturma deneyimiydi. Bir Blog yazısışirket, şimdi görüntü oluşturma işlevini dil modellerinin birincil yeteneği olarak eklemeyi planladığını açıkladı.
![]()
GPT-4O kullanılarak oluşturulan görüntü
Fotoğraf Kredisi: Openai
Bu, şirketin büyük dil modellerinin (LLMS) artık doğal olarak görüntüler üretebileceği ve oluşturulan çıktılara düzenlemeler yapabileceği anlamına geliyor. Bu modellerin büyük parametre boyutu ve eğitim sonrası çabalar nedeniyle, bu modeller tam olarak aradıklarını sağlamak için kullanıcı istemlerinin arkasındaki bağlamı anlamak için çok uygundur. Ayrıca, bunlar dil modelleri olduğundan, metni daha iyi işleyebilir ve doğru bir şekilde işleyebilirler.
Yeni görüntü üreteci, çevrimiçi görüntülerin ve metnin ortak dağılımı konusunda eğitildi. Openai, modelin görüntülerin dille nasıl ilişkili olduğunu ve görüntülerin diğer görüntülerle nasıl ilişkili olduğunu anladığını iddia ediyor. Sonuç olarak, şimdi gelişmiş karakter tutarlılığı ile birlikte geliyor ve kullanıcılar çok fazla ileri geri kalmadan aynı karaktere sahip birden fazla görüntü oluşturabilirler.
![]()
GPT 4O kullanılarak oluşturulan metinli görüntüler
Fotoğraf Kredisi: Openai/Derya Unatmaz ve Les Morgan
Ayrıca, büyük miktarda doğru metin içeren görüntüler de oluşturabilir. Bu, tabelalar, restoran menüleri ve bir beyaz tahtanda yazılmış metin içeren görüntüler üretebileceği anlamına gelir. Kullanıcılar ayrıca bir görüntüyü girdi olarak paylaşabilir ve chatbot onu farklı stillerde yeniden oluşturabilir ve düzenlemeler yapabilir.
ChatGPT ayrıca en son görüntü üreticisi ile çok dönüşlü bir nesil sunacak. Kullanıcılar, AI Chatbot’tan istemleri olan oluşturulan bir görüntüye değişiklik ve eklemeler yapmasını isteyebilecek ve diğer öğeleri değiştirmeden çıktıyı rafine edebilir. Openai, modelin tek bir görüntüde 10-20’ye kadar farklı nesneyi işleyebileceğini ve bu öğeleri doğru bir şekilde ekleyebileceğini iddia etti.
![]()
GPT-4O kullanılarak üretilen fotogerekistik görüntü
Fotoğraf Kredisi: Openai
Bu özellikler şu anda ChatGPT Plus, Team ve Pro aboneleri için kullanılabilir. Başlangıçta ücretsiz katman için de mevcut olsa da, Openai CEO’su Sam Altman bir postalamak X’te (eski adıyla Twitter olarak bilinir) yüksek istek hacmi nedeniyle, ücretsiz katmana sunum süresiz olarak erteleniyor.
Özellikle, birkaç kullanıcı GPT-4O kullanılarak üretilen görüntülerinin ve popüler memeleri Ghibli tarzı rekreasyonlarını paylaşmak için sosyal medya platformlarına gitti. Altman ayrıca X’teki profil resmini imajının Ghibli tarzı bir yorumuna değiştirdi. Ghibli ayrıca sosyal platformda küresel olarak trend oldu.
Güvenliğe gelen Openai, AI tarafından üretilen tüm görüntülerin meta verilerine içerik provenans ve özgünlük (C2PA) bilgileri için koalisyon ekliyor, böylece otantik görüntülerden kolayca ayırt edilebilirler. AI firması ayrıca şirketin modeli tarafından bir görüntü oluşturulup oluşturulmadığını doğrulayabilen dahili bir arama aracı oluşturmuştur.
Bunun dışında şirket, çocuk cinsel istismarı materyali ve cinsel derin yapraklar gibi zararlı içerik içeren görüntüler taleplerini engeller. Ayrıca, kullanıcılar gerçek insanların görüntülerini düzenlerken, şirket oluşturulabilecek görüntü türlerine kısıtlamalar ekledi.

