Teknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor HaberleriTeknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor HaberleriTeknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor Haberleri
Yazı Tipi BoyutlandırıcıAa
  • Anasayfa
  • Teknoloji
    • Siber Güvenlik
    • Yapay Zeka
    • Donanım
    • Bilim
  • Yazılım
  • Savunma & İstihbarat
  • Oyun
  • Yaşam
    • Finans
    • Sinema
    • Dünyadan Haberler
  • İş Birliği
Okuma: Difüzyon transformatörleri OpenAI’nin Sora’sının arkasındaki anahtardır ve GenAI’yi altüst etmeye hazırlar
Paylaş
Yazı Tipi BoyutlandırıcıAa
Teknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor HaberleriTeknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor Haberleri
Ara
Bizi Takip Et
  • Hakkımızda
  • Gizlilik politikası
  • Tanıtım Yazısı ve Backlink Hizmeti
© 2026 Teknomers. All Rights Reserved.

Anasayfa » Difüzyon transformatörleri OpenAI’nin Sora’sının arkasındaki anahtardır ve GenAI’yi altüst etmeye hazırlar

Liste

Difüzyon transformatörleri OpenAI’nin Sora’sının arkasındaki anahtardır ve GenAI’yi altüst etmeye hazırlar

teknomers
Son güncelleme: 28 Şubat 2024 16:59
teknomers
Paylaş
Paylaş


Anında videolar ve etkileşimli 3D ortamlar oluşturabilen OpenAI’nin Sora’sı, GenAI’deki en ileri teknolojinin dikkate değer bir göstergesidir – iyi niyetli bir kilometre taşı.

Ancak ilginçtir ki, buna yol açan yeniliklerden biri, halk dilinde difüzyon transformatörü olarak bilinen bir yapay zeka model mimarisidir. ulaşmış yıllar önce yapay zeka araştırma sahnesindeydi.

Aynı zamanda AI girişimi Stability AI’nin en yeni görüntü oluşturucusu Stable Diffusion 3.0’a da güç veren difüzyon transformatörü, GenAI modellerinin daha önce mümkün olanın ötesine ölçeklenmesini sağlayarak GenAI alanını dönüştürmeye hazır görünüyor.

NYU’da bilgisayar bilimi profesörü olan Saining Xie, difüzyon transformatörünü ortaya çıkaran araştırma projesine Haziran 2022’de başladı. Peebles, Meta’nın yapay zeka araştırma laboratuvarında staj yaparken ve şu anda OpenAI’de Sora’nın eş-başkanlığını yaparken mentisi William Peebles ile birlikte Xie, makine öğrenimindeki iki kavramı birleştirdi — yayılma ve trafo — difüzyon transformatörünü oluşturmak için.

OpenAI’nin DALL-E 3’ü de dahil olmak üzere çoğu modern yapay zeka destekli medya oluşturucu, görüntülerin, videoların, konuşmaların, müziğin, 3D ağların, sanat eserlerinin ve daha fazlasının çıktısını almak için difüzyon adı verilen bir sürece güveniyor.

Bu pek sezgisel bir fikir değil, ancak temel olarak gürültü, bir medya parçasına (örneğin bir görüntüye) tanınmaz hale gelinceye kadar yavaş yavaş eklenir. Bu, gürültülü ortamlardan oluşan bir veri seti oluşturmak için tekrarlanır. Bir yayılma modeli bunun üzerinde eğitim aldığında, hedef çıktı ortamına (örneğin yeni bir görüntü) adım adım yaklaşarak gürültüyü kademeli olarak nasıl çıkaracağını öğrenir.

Difüzyon modelleri tipik olarak U-Net adı verilen bir “omurgaya” veya bir tür motora sahiptir. U-Net omurgası, kaldırılacak gürültüyü tahmin etmeyi öğrenir ve bunu da gayet iyi yapar. Ancak U-Net’ler, difüzyon boru hattını önemli ölçüde yavaşlatabilen özel olarak tasarlanmış modüller nedeniyle karmaşıktır.

Neyse ki transformatörler U-Net’lerin yerini alabilir ve süreçte verimlilik ve performans artışı sağlayabilir.

OpenAI Sora

Sora tarafından oluşturulan bir video.

Transformatörler, GPT-4, Gemini ve ChatGPT gibi modellere güç veren karmaşık akıl yürütme görevleri için tercih edilen mimaridir. Pek çok benzersiz özelliğe sahiptirler, ancak transformatörlerin açık ara belirleyici özelliği onların “dikkat mekanizmasıdır”. Her giriş verisi parçası için (yayılma, görüntü gürültüsü durumunda), transformatörler tartmak diğer tüm girdilerin (görüntüdeki diğer gürültü) alaka düzeyi ve çıktıyı (görüntü gürültüsünün tahmini) oluşturmak için bunlardan yararlanılır.

Dikkat mekanizması transformatörleri diğer model mimarilere göre daha basit hale getirmekle kalmıyor, aynı zamanda mimariyi paralelleştirilebilir hale getiriyor. Başka bir deyişle, gittikçe daha büyük transformatör modelleri, hesaplamada önemli ancak ulaşılamaz olmayan artışlarla eğitilebilir.

Xie, TechCrunch’a bir e-posta röportajında ​​”Transformatörlerin difüzyon sürecine katkısı motor yükseltmesine benzer” dedi. “Transformatörlerin piyasaya sürülmesi… ölçeklenebilirlik ve verimlilik açısından önemli bir sıçramaya işaret ediyor. Bu, özellikle geniş hacimli video verileri üzerinde eğitimden yararlanan ve geniş ölçekte uygulandığında transformatörlerin dönüştürücü potansiyelini sergilemek için kapsamlı model parametrelerinden yararlanan Sora gibi modellerde belirgindir.”

Kararlı Difüzyon 3 tarafından oluşturulmuştur.

Peki, difüzyon transformatörleri fikrinin bir süredir ortaya çıktığı göz önüne alındığında, Sora ve Stable Diffusion gibi projelerin bunlardan yararlanmaya başlaması neden yıllar aldı? Xie, ölçeklenebilir bir omurga modeline sahip olmanın öneminin yakın zamana kadar ortaya çıkmadığını düşünüyor.

“Sora ekibi, bu yaklaşımla büyük ölçekte ne kadar fazlasını yapabileceğinizi göstermek için gerçekten beklenenin çok ötesine geçti” dedi. “U-Net’lerin devre dışı olduğunu açıkça ortaya koydular ve transformatörler için varız yayılma Artık modeller.”

Difüzyon transformatörleri meli Xie, mevcut yayılma modelleri için basit bir takas olabileceğini söylüyor; modeller ister görüntü, ister video, ses veya başka bir medya biçimi oluşturuyor olsun. Difüzyon transformatörlerini eğitmeye yönelik mevcut süreç, potansiyel olarak bazı verimsizliklere ve performans kaybına neden oluyor, ancak Xie, bunun uzun vadede çözülebileceğine inanıyor.

“Asıl çıkarım oldukça basit: U-Net’leri unutun ve U-Net’lere geçin. transformatörler, çünkü daha hızlılar, daha iyi çalışıyorlar ve daha ölçeklenebilirler” dedi. “İçerik anlama ve yaratma alanlarını yayılma transformatörleri çerçevesinde bütünleştirmekle ilgileniyorum. Şu anda bunlar iki farklı dünya gibi; biri anlamak için, diğeri yaratmak için. Bu yönlerin entegre olduğu bir gelecek hayal ediyorum ve bu entegrasyonun sağlanmasının, temel mimarilerin standartlaştırılmasını gerektirdiğine ve transformatörlerin bu amaç için ideal bir aday olduğuna inanıyorum.”

Sora ve Stable Diffusion 3.0, difüzyon transformatörlerinden neler beklenebileceğinin bir önizlemesiyse, çılgın bir yolculuğa çıktığımızı söyleyebilirim.



genel-24

Poco, kullanmaktan utanmayacağım türden bir oyun telefonu yaptı
Verizon Fios veya 5G’ye kaydolarak ücretsiz bir Xbox Series S, 200 ABD Doları Amazon hediye kartı ve 100 ABD Doları Verizon hediye kartı kazanın
Synology’nin en ucuz 2 yuvalı NAS’ı %30’dan fazla indirimli
Motorola Razr 2023 Canlı Görüntüsü Sızdı, Çift Renkli Dış Tasarıma Sahip Olabilir: Rapor
Daily Crunch: Aksaklık, iki saatlik küresel bir kesintiye neden olduktan sonra, WhatsApp hizmeti geri yükler
ETİKETLENDİ:AltüstAnahtardırArkasındakiDifüzyonEtmeyeGenAIgenAIyiHazırlarKararlı DifüzyonKararlılık Yapay ZekasıOpenAIOpenAIninsoraSorasınıntrafoTransformatörleriüretken yapay zekayapay zekaYayılma
Bu Makaleyi Paylaş
Facebook Bağlantıyı Kopyala Yazdır
Paylaş
Önceki Makale Yeni Apple sızıntısı, M3 MacBook Air ve iPad Pro modellerinin çok yakında piyasaya çıkacağını gösteriyor
Sonraki Makale En Güçlü Patlamalarla Evrenin Gizemleri Çözülüyor

Sanal Medya

FacebookBeğen
452Takip Et
PinterestSabitle
237Takip Et

Son Eklenenler

Gears Of War’ta Devrim Niteliğinde Hareket Yeniliği
Oyun
Acil: Yapay Zeka Destekli Windows Terminal ile Tanışın!
Siber Güvenlik
Elegoo Jupiter 2 Reçineli 3D Yazıcı İncelemesi: Dev Geri Döndü
Donanım
Yeni Spyro Oyunu: A Realm Beyond ile Efsane Yeniden Canlanıyor
Oyun
NASA Ay’a Yüksek Teknoloji Prada Termal Giysileriyle Gidecek
Liste
Çin, Saishiteng Dağı’nı Dünyanın En Büyük Astronomi Üssü Yapıyor!
Bilim
//

Siber güvenlik, yapay zeka ve savunma sanayiinden; finans ve sinema dünyasına uzanan geniş bir yelpaze. Teknomers; teknoloji, strateji ve yazılım dünyasını sade bir dille sizlerle buluşturuyor.

Kurumsal

  • Hakkımızda
  • Gizlilik politikası
  • Tanıtım Yazısı ve Backlink Hizmeti

Kategoriler

  • Teknoloji
  • Oyun
  • Sinema
  • Siber Güvenlik
  • Bilim
  • Finans
  • Dünyadan Güncel Haberler

Populer

  • TV'de Ücretsiz İzlenebilen Şifresiz Erotik Kanallar (2025 Güncel Frekans Listesi)

  • The Last of Us PC Kontrolleri: Hızlı Silah Değiştirme ve Tüm Tuşlar (2025)

  • Hogwarts Legacy'de Odaklanma İksiri Nasıl Yapılır?

Teknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor HaberleriTeknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor Haberleri
Bizi Takip Et
© 2026 Teknomers. All Rights Reserved.
Welcome Back!

Sign in to your account

Kullanıcı Adı veya E-posta Adresi
Şifre

Şifrenizi mi unuttunuz?