Sosyal medya güvenliği ipuçları arasında plaka numaraları, sokak adları veya ev numaraları gibi kişisel bilgileri içeren fotoğrafların paylaşılmaması yer alır. Peki ya size üretken yapay zekanın yalnızca fotoğrafınızın arka planını kullanarak sizi hâlâ bulabildiğini söylesem?

Bu, üretken yapay zekanın yeni kullanım örneklerinden biridir. Stanford Üniversitesi’ndeki yüksek lisans öğrencileri, konumunuzu sokak görünümünden ve hatta basit bir görüntüden tespit edebilen bir uygulama geliştirdi.

Görüntü Coğrafi Konumlarını Tahmin Etme (PIGEON) adı verilen proje, çoğu durumda belirli bir konumu yalnızca o konumun Google sokak görünümüne bakarak doğru bir şekilde belirleyebilir.

PIGEON, GeoGuessr oyuncularının %0,01’i arasında yer aldı

PIGEON, gösterilen ülkeyi yüzde 92 doğrulukla tahmin edebiliyor ve tahminlerinin yüzde 40’ından fazlasında hedef konuma 25 kilometre uzaklıktaki bir konumu doğru bir şekilde tespit edebiliyor. Araştırma kağıdı.

Bu sonuçların ne kadar etkileyici olduğunu anlamak için PIGEON, oyuncuların en iyi %0,01’i arasında yer aldı. GeoGuessr, kullanıcıların konumun Google Sokak Görünümü’nden çekilen bir fotoğrafın konumunu tahmin ettiği oyun. Bu oyun bu projenin doğuşu oldu.


PIGEON veri sonuçları


Stanford Üniversitesi

PIGEON ayrıca çevrimiçi olarak 1,7 milyondan fazla izlenmeyle yayınlanan altı maçlık seride dünyanın en iyi GeoGuessr oyuncularından biri olan Trevor Rainbolt’u da mağlup etti.

GÜVERCİN nasıl çalışır?

Öğrenciler, OpenAI tarafından geliştirilen ve görsel kategorilerin adlarını tanıma konusunda eğiterek metin ve görüntüleri birbirine bağlayabilen bir sinir ağı olan CLIP’i kullandılar.

Daha sonra, GeoGuessr’dan ilham alan PIGEON, GeoGuessr’dan rastgele örneklenmiş 100.000 orijinal konumdan oluşan bir veri kümesi ve belirli bir konumdaki tam bir “panorama” kapsayacak şekilde dört görüntüden oluşan bir yükleme kümesi üzerinde eğitildi; bu da toplam 400.000 görüntü oluşturuyor.


Panorama eğitim verileri


Stanford Üniversitesi

Diğer AI modellerinin eğitildiği görüntü sayısı karşılaştırıldığında PIGEON sönük kalır. Referans olarak, OpenAI’nin en popüler görüntü oluşturma modeli DALL-E 2, yüz milyonlarca görüntü üzerinde eğitilmiştir. Araştırmacılar, tek bir görüntüden konum belirlemek için Flickr ve Wikipedia’daki dört milyondan fazla fotoğraf üzerinde eğitilen PIGEOTTO adı verilen başka bir model üzerinde çalıştı.

Görüntü coğrafi etiketlemenin otonom sürüş gibi birçok kullanım durumu vardır

Makaleye göre PIGEOTTO’nun performansı, görüntü coğrafi konum kıyaslamalarında etkileyici sonuçlar elde ederek, şehir doğruluğu açısından önceki son teknoloji sonuçları %7,7 ve ülkelerin kesinliği açısından %29,8 oranında geride bıraktı.

Makalede ayrıca faydalar ve riskler de dahil olmak üzere bu modelle ilgili etik hususlar tartışılmaktadır. Bir yandan, görsellere coğrafi etiketlemenin otonom sürüş, görsel araştırmalar ve fotoğrafın nerede çekildiğiyle ilgili merakı giderme gibi birçok yararlı kullanım durumu vardır.

Bununla birlikte, bu teknolojiyi kullanmanın olumsuz sonuçları, mahremiyetin en bariz ihlalini de içermektedir. Makaleye göre araştırmacıların modellerin ağırlıklarını kamuya açıklamamaya ve kodu yalnızca akademik doğrulama amacıyla yayınlamaya karar vermelerinin nedeni budur.


Kaynak : “ZDNet.com”



genel-15