Kararlılık AI duyurdu Kararlı Difüzyon 3Şirketin görüntü üreten yapay zeka modelinin en yeni ve en güçlü versiyonu. Ayrıntılar az olsa da, bu açıkça OpenAI ve Google’ın yakın zamanda duyurulan rakipleri hakkındaki heyecanı ortadan kaldırmaya yönelik bir girişim.

Yakında tüm bunların daha teknik bir analizini yapacağız, ancak şimdilik şunu bilmelisiniz ki Stable Diffusion 3 (SD3) yeni bir mimariye dayanıyor ve çeşitli donanımlar üzerinde çalışacak (yine de güçlü bir şeye ihtiyacınız olacak) . Henüz çıkmadı ama bekleme listesine kaydolabilirsiniz Burada.

SD3 güncellenmiş bir “difüzyon transformatörü” 2022’de öncülük eden ancak 2023’te revize edilen ve artık ölçeklenebilirliğe ulaşan bir teknik. OpenAI’nin etkileyici video oluşturucusu Sora, görünüşe göre benzer prensipler üzerinde çalışıyor (makalenin ortak yazarı Will Peebles, Sora projesinin ortak liderliğini üstlendi). Ayrıca, çok fazla yük getirmeden kaliteyi benzer şekilde artıran başka bir yeni teknik olan “akış eşleştirmeyi” de kullanıyor.

Model paketi, çeşitli donanımlarda çalışmak amacıyla 800 milyon parametreden (yaygın olarak kullanılan SD 1.5’ten daha az) 8 milyar parametreye (SD XL’den daha fazla) kadar değişir. Muhtemelen yine de ciddi bir GPU ve makine öğrenimi çalışmalarına yönelik bir kurulum isteyeceksiniz, ancak genellikle OpenAI ve Google modellerinde olduğu gibi bir API ile sınırlı değilsiniz. (Antropik, halka açık olarak görüntü veya video oluşturmaya odaklanmadı, dolayısıyla bu konuşmanın bir parçası değil.)

Eski adıyla Twitter olan X’te Stable Diffusion patronu Emad Mostaque, yeni modelin, rakiplerinin API odaklı rakiplerinde vurguladığı her şeyi multimodal anlama, video girişi ve oluşturma yeteneğine sahip olduğunu belirtiyor. Bu yetenekler hala teorik düzeyde ancak gelecek sürümlere dahil edilmelerinin önünde herhangi bir teknik engel yok gibi görünüyor.

Elbette bu modelleri karşılaştırmak imkansız çünkü hiçbiri gerçekten piyasaya sürülmedi ve devam etmemiz gereken tek şey birbiriyle yarışan iddialar ve özenle seçilmiş örnekler. Ancak Stabil Difüzyon’un kesin bir avantajı var: yöntem veya içerik açısından çok az içsel sınırlamayla, her türlü görüntü üretimini herhangi bir yerde yapmak için başvurulacak model olarak zamanın ruhundaki varlığı. (Aslında SD3, güvenlik mekanizmalarını aştığında neredeyse kesinlikle AI tarafından oluşturulan pornoda yeni bir çağ başlatacak.)

Stable Diffusion, ihtiyacınız olduğundan emin olmadığınız butik üretken yapay zeka yerine, onsuz yapamayacağınız beyaz etiketli üretken yapay zeka olmayı istiyor gibi görünüyor. Bu amaçla şirket, kullanım çıtasını düşürmek için takımlarını da geliştiriyor ancak duyurunun geri kalanında olduğu gibi bu iyileştirmeler de hayal gücüne bırakılıyor.

İlginç bir şekilde şirket, duyurusunda güvenliği ön planda tutuyor ve şunu belirtiyor:

Stable Diffusion 3’ün kötü aktörler tarafından kötüye kullanılmasını önlemek için makul adımlar attık ve atmaya devam ediyoruz. Güvenlik, modelimizi eğitmeye başladığımızda başlar ve test, değerlendirme ve dağıtım boyunca devam eder. Bu erken önizlemeye hazırlanırken çok sayıda güvenlik önlemi ekledik. Araştırmacılar, uzmanlar ve topluluğumuzla sürekli işbirliği yaparak, modelin kamuya açıklanmasına yaklaşırken dürüstlükle daha fazla yenilik yapmayı umuyoruz.

Bu korumalar tam olarak nedir? Hiç şüphe yok ki ön izleme bunları bir şekilde tasvir edecek ve ardından halka açık yayın, bu şeylere bakış açınıza bağlı olarak daha da hassaslaştırılacak veya sansürlenecek. Yakında daha fazlasını öğreneceğiz ve bu arada bu yeni nesil modellerin arkasındaki teori ve yöntemleri daha iyi anlamak için işin teknik yönüne dalacağız.



genel-24