Teknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor HaberleriTeknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor HaberleriTeknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor Haberleri
Yazı Tipi BoyutlandırıcıAa
  • Anasayfa
  • Teknoloji
    • Siber Güvenlik
    • Yapay Zeka
    • Donanım
    • Bilim
  • Yazılım
  • Savunma & İstihbarat
  • Oyun
  • Yaşam
    • Finans
    • Sinema
    • Dünyadan Haberler
  • İş Birliği
Okuma: OpenAI, ‘tutarlılık’ tabanlı görüntü üreteci ile difüzyonun ötesine bakıyor
Paylaş
Yazı Tipi BoyutlandırıcıAa
Teknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor HaberleriTeknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor Haberleri
Ara
Bizi Takip Et
  • Hakkımızda
  • Gizlilik politikası
  • Tanıtım Yazısı ve Backlink Hizmeti
© 2026 Teknomers. All Rights Reserved.

Anasayfa » OpenAI, ‘tutarlılık’ tabanlı görüntü üreteci ile difüzyonun ötesine bakıyor

Liste

OpenAI, ‘tutarlılık’ tabanlı görüntü üreteci ile difüzyonun ötesine bakıyor

teknomers
Son güncelleme: 12 Nisan 2023 22:24
teknomers
Paylaş
Paylaş


Görüntü oluşturma alanı hızla hareket eder. Midjourney ve Stable Diffusion gibi popüler araçlar tarafından kullanılan difüzyon modelleri elimizdekilerin en iyisi gibi görünse de, bir sonraki şey her zaman geliyor – ve OpenAI zaten basit görevleri yerine getirebilen “tutarlılık modelleri” ile bunu başarmış olabilir. DALL-E benzerlerinden çok daha hızlı.

kağıt Geçen ay bir ön baskı olarak internete koyve ana sürümleri için abartısız tantana OpenAI rezervleri eşlik etmedi. Bu hiç de şaşırtıcı değil: Bu kesinlikle sadece bir araştırma makalesi ve çok teknik. Ancak bu erken ve deneysel tekniğin sonuçları dikkate değerdir.

Tutarlılık modellerini açıklamak özellikle kolay değildir, ancak difüzyon modellerinin aksine daha anlamlıdır.

Difüzyonda bir model, tamamen gürültüden oluşan bir başlangıç ​​görüntüsünden gürültüyü kademeli olarak nasıl çıkaracağını öğrenir ve onu adım adım hedef komut istemine yaklaştırır. Bu yaklaşım, günümüzün en etkileyici AI görüntülerini mümkün kıldı, ancak temelde, iyi sonuçlar almak için on ila binlerce adım arasında herhangi bir yerde performans göstermeye dayanıyor. Bu, çalıştırmanın pahalı olduğu ve aynı zamanda gerçek zamanlı uygulamaların pratik olmayacağı kadar yavaş olduğu anlamına gelir.

Tutarlılık modelleriyle amaç, tek bir veya en fazla iki hesaplama adımında iyi sonuçlar veren bir şey yapmaktı. Bunu yapmak için, model, bir difüzyon modeli gibi, görüntü yok etme sürecini gözlemlemek üzere eğitilir, ancak herhangi bir karartma düzeyinde (yani, az veya çok bilgi eksikken) bir görüntü almayı ve tam bir kaynak görüntü oluşturmayı öğrenir. sadece bir adım

Ama hemen şunu eklemeliyim ki, bu olan bitenin yalnızca en dandik açıklamasıdır. Bu tür bir kağıt:

Tutarlılık belgesinden temsili bir alıntı.

Ortaya çıkan görüntüler akıllara durgunluk vermiyor – görüntülerin birçoğunun iyi olduğu bile söylenemez. Ama önemli olan yüz bin değil, tek adımda üretilmiş olmalarıdır. Ayrıca tutarlılık modeli, renklendirme, ölçek yükseltme, eskiz yorumlama, doldurma vb.

Görüntü ister çoğunlukla gürültü ister çoğunlukla veri olsun, tutarlılık modelleri doğrudan nihai sonuca gider.

Bu önemlidir, çünkü makine öğrenimi araştırmasındaki model genellikle birisinin bir teknik oluşturması, başka birinin daha iyi çalışmasını sağlamanın bir yolunu bulması ve ardından diğerlerinin sizin başladığınızdan çok daha iyi sonuçlar elde etmek için hesaplama ekleyerek zamanla onu ayarlamasıdır. Hem modern difüzyon modellerine hem de ChatGPT’ye aşağı yukarı böyle ulaştık. Bu, kendi kendini sınırlayan bir süreçtir çünkü pratikte belirli bir göreve yalnızca çok fazla hesaplama ayırabilirsiniz.

Ancak bundan sonra olan şey, önceki modelin yaptığını yapabilen, ilk başta çok daha kötü ama aynı zamanda çok daha verimli olan yeni, daha verimli bir tekniğin tanımlanmasıdır. Tutarlılık modelleri, difüzyon modelleriyle doğrudan karşılaştırılamayacak kadar erken olmasına rağmen bunu göstermektedir.

Ancak başka bir düzeyde önemli çünkü şu anda dünyanın en etkili AI araştırma ekibi olan OpenAI’nin yeni nesil kullanım durumlarında aktif olarak geçmiş yayılıma nasıl baktığını gösteriyor.

Evet, bir GPU kümesi kullanarak bir veya iki dakikada 1500 yineleme yapmak istiyorsanız, difüzyon modellerinden çarpıcı sonuçlar alabilirsiniz. Ancak, birinin telefonunda pilini tüketmeden bir görüntü oluşturucu çalıştırmak veya örneğin canlı bir sohbet arabiriminde ultra hızlı sonuçlar sağlamak isterseniz ne olur? Difüzyon, bu iş için kesinlikle yanlış bir araçtır ve OpenAI araştırmacıları aktif olarak doğru olanı arıyorlar – diğer yazarların, Yang Song, Prafulla Dhariwal ve diğer yazarların katkılarını küçümsememek için, bu alanda iyi bilinen bir isim olan Ilya Sutskever dahil. Mark Chen.

Tutarlılık modellerinin OpenAI için bir sonraki büyük adım mı yoksa sadağında başka bir ok mu olduğu – gelecek neredeyse kesinlikle hem çok modlu hem de çok modeldir – araştırmanın nasıl sonuçlanacağına bağlı olacaktır. Daha fazla ayrıntı istedim ve araştırmacılardan yanıt alırsam bu gönderiyi güncelleyeceğim.



genel-24

Düzenleyiciler Amazon ve Meta’nın nükleer enerji hedeflerine ardı ardına darbeler indiriyor
Don Draper’ın Metreslerinin 19’unun Tamamı Açıklandı
Kök Hücre Klinikleri Uzun Süreli Kovid İçin Şüpheli, Kanıtlanmamış Tedaviler Satıyor
Marvel’ın Bir Sonraki Star Wars Bölümü, Jedi’ın Dönüşünden Sonra Kalan Karmaşık Duygularla Oynuyor
ABD Musluk Suyunun Neredeyse Yarısı PFAS ile Kirlenmiş
ETİKETLENDİ:bakıyordifüzyonunGörüntüileOpenAIötesinetabanlıTutarlılıküreteci
Bu Makaleyi Paylaş
Facebook Bağlantıyı Kopyala Yazdır
Paylaş
Önceki Makale Cardano Balinaları Biriktirme Faaliyetlerini Artırıyor, Son İki Haftadan Elde Edilen Veriler
Sonraki Makale Galaxy Z Flip 5 ve Galaxy Z Fold 5: Samsung neden favorileri oynamayı seçti?

Sanal Medya

FacebookBeğen
452Takip Et
PinterestSabitle
237Takip Et

Son Eklenenler

Grand Theft Auto VI Oyun Dünyasında Tarihleri Değiştiriyor
Liste
Microsoft’un Mojo’su Geri Mi Gidiyor? AI ve Yenilikler Ne Diyor?
Genel
Donanım Dünyası: Computex 2026, 4. Gün – B2B Değişimi ve Taipei’ye Veda
Donanım
Guild Wars 3 Geliyor, MMORPG Dünyasında Yenilikler Sunuyor
Oyun
N++ Ekibinin Geri Dönüşü: Çok Oyunculu Devam Oyunu Geliyor
Liste
Müzik Oyunları Dünyasında Fırtına Yaratacak Mr. Records
Oyun
//

Siber güvenlik, yapay zeka ve savunma sanayiinden; finans ve sinema dünyasına uzanan geniş bir yelpaze. Teknomers; teknoloji, strateji ve yazılım dünyasını sade bir dille sizlerle buluşturuyor.

Kurumsal

  • Hakkımızda
  • Gizlilik politikası
  • Tanıtım Yazısı ve Backlink Hizmeti

Kategoriler

  • Teknoloji
  • Oyun
  • Sinema
  • Siber Güvenlik
  • Bilim
  • Finans
  • Dünyadan Güncel Haberler

Populer

  • TV'de Ücretsiz İzlenebilen Şifresiz Erotik Kanallar (2025 Güncel Frekans Listesi)

  • The Last of Us PC Kontrolleri: Hızlı Silah Değiştirme ve Tüm Tuşlar (2025)

  • Hogwarts Legacy'de Odaklanma İksiri Nasıl Yapılır?

Teknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor HaberleriTeknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor Haberleri
Bizi Takip Et
© 2026 Teknomers. All Rights Reserved.
Welcome Back!

Sign in to your account

Kullanıcı Adı veya E-posta Adresi
Şifre

Şifrenizi mi unuttunuz?