Büyük Veri ve Yapay Zeka Sergisi 2023, Paris – Elbette üretken yapay zeka birçok kurumsal toplantıda yer alıyor. Belki de yapay zeka alanındaki çalışmaların ChatGPT’nin gürültüsünden çok uzakta ilerlediğini unutacak noktaya kadar. Örneğin denetimsiz öğrenme en umut verici tekniklerden biridir. Verilerin etiketlenmediği (denetlenen öğrenmeden farklı olarak), otomatik öğrenmenin (Makine Öğrenimi olarak da adlandırılan) bu çeşidi, bir denetçinin yardımı olmadan ortak özellikler sunan sınıfları veya nesne gruplarını çıkarır.
Bu tekniğin amacı, bu etiketlenmemiş verilerin altında yatan yapıları keşfetmektir ve yapay zekanın performans açısından bunu ne kadar ileri götürebileceğini denemenin bir yoludur. Armand Joulin, yapay zeka araştırmacısı, bu noktada Big Data & IA Show’da denetimsiz bir öğrenme tekniği kullanarak görsel tanıma yapay zekasının eğitimi üzerine çalışmalarını sundu. Meta tarafından ses tanıma için zaten kullanılan bir teknik.
“Yapay zeka görüntü tanıma, denetimli öğrenmeyle başladı” diye hatırlıyor. “Bu teknikle bir makineye bir görüntü veriyoruz ve ondan bu görüntüyle bir nesneyi tanımak gibi bir görev yapmasını istiyoruz. Bunun için görüntüleri etiketliyoruz ve makineye etiketleri tanımayı öğretiyoruz.”
Videoda nesne tanıma nasıl yapılır?
“Bu çok etkili ama zaman alıcı bir yöntem. Aynı zamanda sınırlamaları da var çünkü örneğin görüntü tanımadan videoya geçmek bir yapay zekanın eğitilmesini gerektiriyor.” Modern akıllı telefonlar, kameralara ek olarak kızılötesi gibi giderek daha fazla sensör içeriyor. Araştırmacı, “Burada da kızılötesi görüntü tanıma işlemi yeni bir yapay zeka oluşturmayı gerektiriyor” diyor.
Her şeyden önce sınıflandırma, görsel tanıma için yalnızca bir kullanım durumudur. İntihale karşı mücadelede kopya tespiti, stil aktarımı ve hatta altyazı ekleme, bir makineden istenebilecek görevlerdir… her seferinde yeni bir sinir ağıyla bu özel görev için eğitilmesi koşuluyla.
Armand Joulin bu nedenle bir makinenin, yeni sinir ağlarını eğitmek zorunda kalmadan her yerde kullanılabilecek işlevleri öğrenmesi için bir yöntem bulmaya çalışıyor. Ve iki ön koşul koyuyor
- Makineyi öğrenirken farklı medyalar (video, fotoğraf, selfie, radyo vb.) konusunda “eğitilmesi” gerekir.
- Bir görüntüden metin yazmak gibi basit bir göreve ihtiyacınız var.
“Fakat sorun şu ki” diyor, “biraz farklı iki görüntüyü sıklıkla aynı şekilde tanımlıyoruz.” Bu nedenle, makineden kendisine bir görüntüde sunulanı değil, iki görsel arasındaki farkları açıklamasını isteme fikri ortaya çıktı. Bunu yapmak için araştırmacı yapay zekaya çok sayıda görüntüyü karşılaştırır ve böylece ona farklılıkları not etmeyi öğretir.
Bir kedi fotoğrafını tanımak iyidir, ancak iki kedi fotoğrafı arasındaki farkları tanıyarak onları tanımlamak çok daha iyidir.
“Denetim yok” olarak adlandırılan bu tekniğin denetimli öğrenmeden daha verimli olduğunu garanti ediyor.
Bu ayrım tekniğiyle yapay zeka, görselleri etiketlemeden farklı veya benzer olana göre sınıflandırabiliyor. Denetimsiz bir sınıflandırma şeklidir.
“Bu teknoloji sayesinde makine, kendisine sunduğumuz görsel veya videonun en ayırt edici kısmını tespit ediyor” diye açıklıyor.
Yapay zeka farklılıkların yanı sıra çok farklı ortamlar üzerindeki benzerlikleri de tanıyabilir. Bu, denetimsiz öğrenmeyle eğitilmiş yapay zekanın yeteneklerinden biridir.
“Yapay zekanın yapamadıklarının dönüm noktasını geçtik”
Ayrıca fotoğraf ve video gibi farklı medyaların yanı sıra 3 boyutlu nesnelerle de uçaklar ve kuşlar arasındaki ortak noktaların neler olduğunu kendisine sormak mümkün.
“Bu sistemle videoda nesne tanıma mümkün oluyor, yapay zeka uçaklar ve kartallar arasındaki farkları ve benzerlikleri belirliyor” diyor.
Ve sonuç olarak: “Artık yapay zekanın görsel tanıma açısından yapamayacağı dönüm noktasını geçtik”.