Ne bilmek istiyorsun
- Stanford Üniversitesi Lisansüstü Öğrencileri, Google Sokak Görünümü’ne göre tam konumunuzu belirleyebilen, yapay zeka destekli bir uygulama geliştirdi.
- Araç %92 doğruluk vaat ediyor ve tahminlerinin %40’ından fazlasında konumu kesin konumdan 25 kilometreye kadar daraltıyor.
- Uygulama, karşılaştırmaları çalıştırırken ünlü GeoGuessr oyuncusu Trevor Rainbolt’u altı maçta yendi.
- Uygulama, OpenAI’nin metinleri resimlere bağlamasına olanak tanıyan CLIP sinir ağını temel alıyor.
- Model, güvenlik ve gizlilik endişeleri nedeniyle geniş çapta satışa sunulmadı.
Üretken yapay zeka 2023’te çok büyüktü ve 2024’te de aynı tempoyu sürdürmesi bekleniyor. Kuşkusuz kullanıcılar teknolojiyle epeyce uğraştı ve sonuçta tıp, eğitim, siyaset ve genel olarak teknoloji alanlarında inanılmaz başarılar elde etti. Microsoft, özellikle OpenAI teknolojisine milyarlarca dolarlık yatırım yaptıktan sonra yapay zekayı çoğu ürün ve hizmetine dahil etme konusunda ön sıralarda yer aldı.
Aynı ölçüde teknoloji, güvenlik ve mahremiyet konusunda da aksaklıklar yaşadı. Bu, kullanıcıları uç noktalara sürükledi ve yapay zekaya yönelik çekincelerini açıkça ifade etti. Biden’ın yönetimi bu konuyu değerlendirdi ve sonuç olarak teknolojinin kullanımının yönetilmesine yardımcı olacak korkulukların yerleştirilmesi için tasarlanmış bir Yönetici Kararı çıkarılmasına yol açtı.
İLGİLİ: ABD hükümetinin ihracat kuralları, Çin’den gelen 5 milyar dolar değerindeki gelişmiş AI GPU’ları engelliyor
Yeni yıla başlarken yapay zeka tehdit oluşturmaya devam ediyor (özellikle sessiz ve özel bir hayat sürmeyi tercih eden kullanıcılar için). Sosyal medya hayatınızı tüm dünyaya açar. Neyse ki, sosyal medya hesaplarınızı özel yapmak, yorum yapma ve durum görüntüleme yeteneklerini sınırlamak ve hatta fotoğraf paylaşırken tam konumu dahil etmemeyi seçmek de dahil olmak üzere, biraz gizlilik sağlamak için yararlanabileceğiniz birkaç ayrıntılı önlem var.
Ancak yukarıdaki önlemlere rağmen yapay zekanın tam konumunuzu belirleyebileceğini biliyor muydunuz? Geçen yıl Stanford Üniversitesi’nden bir grup yüksek lisans öğrencisi şunu geliştirdi: AI destekli bir uygulama bir fotoğrafa dayalı olarak tam konumunuzu belirleme ve belirleme özelliğine sahiptir. Uygulama, fotoğrafta sunulan sokak görünümüne veya genel olarak paylaşılan görsel kaynağına göre konumunuzu daraltabilir.
Görüntünün Coğrafi Konumlarını Tahmin Etme (PIGEON) adlı projeye göre uygulama, konumun Google Sokak Görünümü’ne bakarak bir fotoğrafın çekildiği yerin tam konumunu belirleyebiliyor. Üstelik uygulama, fotoğrafın çekildiği yeri daraltırken %92 doğruluk oranı vaat ediyor. Uygulama ayrıca tahminlerinin %40’ından fazlasında konumu tam konumdan 25 kilometreye kadar daraltabiliyor.
Bunu perspektife koyarsak PIGEON, GeoGuessr oyuncuları arasında ilk %0,01’lik dilimde yer aldı. Bilmeyenler için GeoGuessing, Google Sokak Görünümü’ne dayanarak bir fotoğrafın çekildiği yerin tam yerini tahmin etmenizin beklendiği bir coğrafya oyunudur. Biraz bağlam açısından, PIGEON’un tüm önermesi buydu.
GÜVERCİN nasıl çalışır?
Uygulama, OpenAI’nin metin ve görselleri birbirine bağlama özelliğiyle birlikte gelen CLIP sinir ağı tarafından desteklenmektedir. Model, odaklanılacak görsel kategorilerin adları konusunda eğitilmiştir. Altı maçlık seride dünyaca ünlü GeoGuessr oyuncusu Trevor Rainbolt’u yendi.
PIGEON projesinin başlangıcında Stanford Üniversitesi mezunları, uygulamayı GeoGuessr’dan rastgele örneklenen 100.000 orijinal konumu kullanarak eğitti. Mezunlar ayrıca belirli bir konumdaki bir “panorama”nın tamamını kapsayacak şekilde dört görüntü indirdiler ve bu da 400.000 görüntüye karşılık geliyor.
PIGEON projesinin mezunlarından birine göre:
“Yaklaşık 500.000 sokak görünümü görüntüsünden oluşan kendi veri kümemizi oluşturduk. Bu aslında çok fazla veri değil, [and] Oldukça muhteşem bir performans elde etmeyi başardık.”
PIGEON, belirli bir konumu belirlerken bitki örtüsü ve hava durumu gibi önemli ayrıntıları yakalayabilir. OpenAI’nin DALL-E 2 gibi diğer modelleriyle karşılaştırıldığında inanılmaz performans göstermesinin ana nedeni budur. Buna karşılık, DALL-E 2 milyonlarca görüntü kullanılarak eğitilir, onu daha da iyi hale getirmek için mevcut geniş kaynakları unutmadan, ancak PIGEON yine de daha iyi sonuçlar yayınlar. .
Büyük gizlilik ihlali yaklaşıyor
Bu, potansiyel olarak büyük bir gelişmeye yol açabilecek inanılmaz bir başarı olsa da, AI destekli uygulamanın genel kullanıma sunulması durumunda yaratacağı olumsuz sonuçları düşünmeden edemiyorum.
DEVAMINI OKU: New York Times, telif hakkı sorunları nedeniyle Microsoft ve OpenAI’ye dava açtı
Stanford mezunları, otonom sürüş, görsel incelemeler, güvenlik ve daha fazlası söz konusu olduğunda uygulamanın etkili bir araç olabileceğini vurguladı. Ancak teknoloji yanlış ellere geçerse ve amacı dışında kötü amaçlarla kullanılırsa, oluşabilecek hasar oldukça endişe vericidir.
Bu nedenle model halka açıklanmadı. Projede paylaşıldığı gibi öğrenciler kodu yalnızca akademik amaçlı paylaştılar.
Sonuç olarak öğrenciler model ağırlıklarını kamuya açıklamamaya karar verdiler ve makaleye göre kodu yalnızca akademik doğrulama için yayınladılar.
Bu gelişen teknoloji ve bunun gizlilik ve güvenlik üzerindeki uzun vadeli etkileri hakkındaki düşünceleriniz nelerdir? Yorumlarda bize bildirin.