Şirin teknoloji paylaşımlı dairemiz Casa Casi’de bildiğimiz gibi yapay zeka konusu uzun süredir devam eden bir konu. Bu nedenle Fabi ve benim, ChatGPT şirketi OpenAI’nin yakın zamanda sunduğu yeni metinden videoya yapay zeka Sora hakkında acilen konuşmaya ihtiyaç duymamız şaşırtıcı değil.
Kendimizi kandırmayalım: Yapay zeka alanında şu anda o kadar çok şey oluyor ki, bırakın konuşmayı, tüm yeni gelişmeleri takip bile edemiyoruz. YouTube’da “Bu yapay zeka aracı HER ŞEYİ değiştirecek” söylentilerinin bombardımanına maruz kalırken, hatta bu haftaki gibi bir duyuru bile… Stabil Difüzyon 3 duyuruldu – birçok insan için sadece yorgun bir kaş çatma (Fransızcamı bağışlayın).
Bilgi istemi: Sınıftaki bir masanın üzerinde kırmızı bir elmanın sinematik fotoğrafı, tahtada tebeşirle yazılmış “büyük ol ya da eve git” kelimeleri var pic.twitter.com/R67JMIRHJw
— Stabilite Yapay Zekası (@StabilityAI) 22 Şubat 2024
Ancak Dall-E ve tabii ki ChatGPT’den sorumlu olan Open AI, metin komutlarını videolara dönüştüren yeni bir platform sunduğunda, tüm teknoloji dünyası bunu fark etti.
OpenAI Sora’yı tanıtıyor ve ağızları açık bırakıyor
Teknoloji ortak dairemizde sıklıkla yapay zekadan bahsediyoruz ve bu nedenle zamanın nabzını tuttuğumuzu hayal ediyoruz. Ama aslında listemizde bu kalitede Sora yoktu. Öncelikle bu “Sora”nın gerçekte ne olduğunu açıklayalım:
Sora, OpenAI’nin bir başka yapay zekasıdır; daha doğrusu, bir istemden bir dakikalık FullHD video oluşturabilen üretken bir yapay zeka modelidir. Burada henüz geliştirilme aşamasında olan ve bu nedenle henüz herkesin erişimine açık olmayan bir modelle karşı karşıyayız. Bu sadece metin girişinden videolar oluşturmakla ilgili değil, her şeyden önce fiziksel yasaları, yani hareketler, yansımalar, gölgeler vb. kadar gerçekçi bir şekilde temsil etmekle ilgili. Bu, pek çok benzer platformun şimdiye kadar başaramadığı şey.
Görünüşe göre OpenAI, ChatGPT’de olduğu gibi öncelikle herkes tarafından kullanılabilecek bir ürün değil, bir simülasyon yaratmayı amaçlıyor. Bu durum onların tüketici pazarından ziyade iş pazarını hedeflediklerini gösteriyor olabilir. Şu anda zarar eden şirketin bir noktada para kazanması gerekiyor, değil mi? Ama bunun üzerinde durmayalım, Sora’nın neler sunduğuna daha yakından bakalım. Aşağıdaki videoda yalnızca Sora ile oluşturulan dizileri görmekle kalmıyor, aynı zamanda istemlerin de dahil olduğunu görüyorsunuz.
Ve? Çok etkileyici, değil mi? Evet biliyorum: Tek tek videolara dikkatlice bakarsanız pek çok hata var. Ama hâlâ bir yıl öncesine göre tamamen farklı bir düzeyde gerçekleşiyor. Ve yine bu kararsızlık ortaya çıkıyor: teknoloji beni büyülüyor ve gelecekte mümkün olabilecek sayısız uygulama senaryosu hakkında düşünmemi sağlıyor. Ancak diğer yandan olumsuz yönde de tetiklenebilecek bir ürkütücülük var.
Yapay zeka ikilemi
Bu aynı zamanda podcast’te Fabi ile yaptığımız diyalogda da rol oynuyor, çünkü bu konudaki heyecan verici teknolojiden tamamen memnun olamayız. Daha ziyade mevzuat açısından ne gibi düzenlemeler yapılması gerektiğini düşünüyoruz. Açık AI elbette şirketin Sora’yı olabildiğince güvenli hale getirmek için mümkün olan her şeyi yaptığını açıklıyor:
Örneğin OpenAI, Red Teamer’larla buluştuklarını bize bildiriyor. Bu nedenle uzmanların yanlış bilgi, nefret dolu içerik ve önyargılar söz konusu olduğunda güvenlik risklerini araştırması gerekir. Videolar ayrıca yapay zeka tarafından oluşturulmuş olarak işaretlenmeli ve belirli istem istekleri kendi başına yürütülmeyecektir. Sistem, “kullanım yönergelerimizi ihlal eden, ör. B. çıktı olarak aşırı şiddet, cinsel içerik, nefret dolu görüntüler, ünlü benzerliği veya başkalarının haklarını talep edenler. Ayrıca, kullanıcıya gösterilmeden önce kullanım yönergelerimize uygun olduğundan emin olmak için oluşturulan her videonun karelerini kontrol eden güçlü görüntü sınıflandırıcılar da geliştirdik.”
Sanatçılar teknik açıdan olduğu kadar politika ve düzenleyici otoriteler açısından da kapsanmaktadır. Bu nedenle, platformun kötüye kullanımını engellemek için akla gelebilecek her düzeyde hangi olası engellerin aşılması gerektiğini öğrenmek istiyorsunuz.
Bu tür yapay zeka modellerinin geliştirilmesi söz konusu olduğunda (en az bir) ikilemin farkındayım: Bu modeller, günümüzde yapay zeka tarafından oluşturulduğu neredeyse hiç kabul edilmeyen, giderek daha gerçekçi hale gelen metinler, fotoğraflar ve videolar üretiyor. Bu, toplum olarak zaten yapay zeka videoları olmasa bile sahtekarlıklardan, yalanlardan ve yanlış beyanlardan bunalmış olduğumuz bir zamanda gerçekleşiyor. Bugün bir fotoğrafın, bir videonun ya da bir başlığın gerçekten gerçek olup olmadığı pek kimsenin umurunda değilse, klipte filigran bulunmasının herhangi bir etkisi olur mu?
Ayrıca Open AI’nin iletişimini ne kadar gerçek anlamda değerlendirdiğimden de emin değilim. Politika konusunda gerçekten ciddiler mi ve tüm itiraz ve kaygılarla açıkça ilgilenmeye istekliler mi? Buna inanmak istiyorum ama Açık Yapay Zeka, Sora’nın tam olarak nasıl eğitildiğini veya hangi verilerle eğitildiğini bile bize bildirmiyor.
Aynen öyle: Noel’deki küçük çocuklar gibi, teknolojik gelişmelere hayret ediyoruz ve her şeyin hayatımızı kolaylaştırdığı, güzelleştirdiği ütopyalar hayal ediyoruz. Ama sanki kafamızdaki uyarı niteliğindeki küçük bir adam kafatasımızın tepesine vuruyormuş gibi olan bu huzursuzluk hissi bir türlü ortadan kaybolmuyor. Çünkü her zaman bir şeyin farkında olmalıyız: AI videoları ve fotoğrafları hiçbir zaman bugünkü kadar kötü olmayacak! Teknoloji durdurulamaz ve bu nedenle önümüze çok daha gerçekçi içerikler çıkıyor; yarından ziyade bugün!
Belki siz de bu kararsız duygu konusunda aynı şekilde hissediyor musunuz? Peki hangi çözümleri düşünebilirsiniz? Bunu bize yorumlarda yazmaktan çekinmeyin – ancak elbette ancak Casa Casi’nin bugünkü bölümünü dinledikten ve umarız iyice eğlendikten sonra.