Bir grup Adobe araştırmacıları yakın zamanda VideoGigaGAN adında yeni bir üretken yapay zeka modeli hakkında bir makale yayınladı ve bunun gelecekteki bir üründe piyasaya sürülebileceğine inanıyoruz. Yaptığı şey, düşük kaliteli videoları, kararlılıktan veya kaynak malzemenin önemli yönlerinden ödün vermeden, orijinal çözünürlüklerinin sekiz katına kadar yükseltmektir. Çeşitli demo kliplerini şu adreste bulabilirsiniz: projenin web sitesi yeteneklerini sergiliyor. Bir şelalenin 128×128 piksel çözünürlükteki bulanık videosunu, 1.024×1.024 piksel çözünürlükte çalışan görüntülere dönüştürebiliyor.
Gönderen: @luokai
Konularda Görüntüle
Yapay zekanın dikkat çekici yanı, daha ince ayrıntıları gözden kaçırmamasıdır. İnsan deneklerin yüzlerinde cilt dokusu, kırışıklıklar, saç telleri ve daha fazlası görülebiliyor. Diğer demolar da benzer düzeyde kaliteye sahiptir. Bu teknoloji sayesinde gölette yüzen kuğuyu ve ağaçtaki çiçeği daha iyi görebiliyorsunuz. Cilt kırışıklıklarına veya tüylere bu kadar odaklanmak tuhaf görünebilir. Ancak Adobe gibi şirketlerin, görüntü iyileştirici yapay zekayı geniş ölçekte uygulamayı hedefliyorlarsa bu düzeyde ayrıntıyı belirlemeleri gerekiyor.
Yapay zekanın iyileştirilmesi
Muhtemelen platformun en son projesi hakkında nasıl çalıştığına dair birkaç sorunuz var mı? Aslında durum karmaşık.
VideoGigaGAN’daki “GAN”, gerçekçi görüntüler oluşturabilen bir tür yapay zeka olan üretken rekabet ağı anlamına gelir. Adobe’nin sürümü özellikle aşağıdakilere dayanmaktadır: GigaGAN Gerçek fotoğrafların yanı sıra oluşturulan içeriğin ölçeklendirilmesinde uzmanlaşmıştır. Bu teknolojiyle ilgili sorun şu şekilde: Sınır Garip eserler gibi birden fazla sorun ortaya çıkmadan videoların kalitesini artıramayacağına dikkat çekiyor. Bu sorunu çözmek için Adobe araştırmacıları çeşitli teknikler kullandı.
Araştırma makalesi tüm süreci açıklıyor. Yoğun bir materyal olmasına rağmen resmin tamamını görmek için kendiniz okuyabilirsiniz. Temel olarak, bir videonun kareleri arasında tutarlılık sağlamak için bir “akış yönlendirmeli yayılma modülü”, yapaylıkları azaltmak için kenar yumuşatma ve ayrıntılardaki ani düşüşleri telafi etmek için bir “yüksek frekanslı özellik mekiği” tanıttılar. VideoGigaGAN’da az önce tanımladığımızdan daha fazlası var, ama işin özü bu.
Potansiyel katılım
Bunu yakında çıkacak bir Adobe ürününde mi göreceğiz yoksa bağımsız bir uygulama olarak mı sunacağız? Büyük ihtimalle – en azından biz öyle düşünüyoruz.
Geçtiğimiz yıl şirket, Firefly’ın piyasaya sürülmesinden Acrobat’ın yeni asistanına kadar yazılımında yapay zekayı uygulamaya yoğun bir şekilde odaklandı. Birkaç ay önce Adobe MAX 2023 sırasında, video yükseltme aracı olarak adlandırılan Proje Yeniden Başlatıldı etkinlikte ön gösterimi yapıldı ve performansı VideoGigaGAN demolarında gördüğümüze benziyor. 1940’lardan kalma eski bir film, 480 x 360 görüntü çözünürlüğünden net 1.280 x 960 görüntü çözünürlüğüne geçiyor. Nehirdeki bir filin bulanık görüntüleri kristal netliğinde oluyor. Sunucu, yazılımın bir klibi orijinal kalitesinin dört katına nasıl yükseltebildiğinden bile bahsediyor.
Kuşkusuz bu bir varsayımdır, ancak VideoGigaGAN’ın Res-Up’ın arkasındaki motor olabileceği tamamen mümkündür. Adobe’nin gelecekteki ürünü, insanlara eski aile videolarını veya düşük kaliteli çekimleri, kafamızda canlandırdığımız filme yükseltmenin bir yolunu sunabilir. Belki de son ön izleme, yakında piyasaya sürüleceğine dair bir ipucudur.
VideoGigaGAN hâlâ geliştirme aşamasında olduğundan ne zaman çıkıp çıkmayacağı bilinmiyor. Yolda çeşitli engeller var. Yapay zeka, 200 karenin üzerindeki videoları düzgün bir şekilde işleyemez veya küçük nesneleri oluşturamaz, ancak kesinlikle gözümüz üzerinde olacak.
Bu arada TechRadar’ın 2024’ün en iyi yapay zeka görüntü yükselticileri listesine göz atın.