Sam Altman’ın OpenAI’si artık ChatGPT 4’ün ne kadar yetenekli olduğundan korkmaya başladı. Görme engellilere yardım edecek bir proje olarak başlayan şey, şimdi OpenAI’nin AI modelinin çok güçlü, belki de çok güçlü hale geldiğini gösterdi.
OpenAI’nin ChatGPT’sindeki son gelişmeler, özellikle GPT-4’ün tanıtımı, yeteneklerini metin tabanlı etkileşimlerin ötesine genişletti. Dikkate değer bir ekleme, kullanıcıların görsel içeriği kullanarak sohbet robotuyla etkileşim kurmasına olanak tanıyan görüntü analizidir. Bu güncelleme ile kullanıcılar görüntüleri tanımlayabilir, onlar hakkında sorular sorabilir ve hatta belirli kişileri tanımlamak için yüz tanıma özelliğini kullanabilir.
Bu teknolojinin potansiyel uygulamaları çok geniş ve umut vericidir. Görüntüleri analiz ederek veya şaşırtıcı bir kızarıklık hakkında bilgi sağlayarak arızalı bir araba motorunu giderme gibi görevlerde kullanıcılara yardımcı olabilir. Bu gelişmeler, görüntüyle ilgili zorlukların üstesinden gelmek ve problem çözme yeteneklerini geliştirmek için yapay zekadan yararlanmak için yeni olanaklar sunuyor.
Görme engelliler için bir iş ve işçi bulma kurumunun CEO’su Jonathan Mosen, ChatGPT’nin gelişmiş sürümünü erken benimseyenlerden biridir. Yakın zamanda yaptığı bir gezi sırasında, chatbot’un görsel analiz özelliğini keşfetme fırsatı buldu. ChatGPT’nin yardımıyla Mosen, bir otel banyosundaki çeşitli dağıtıcıların içeriğini tanıyıp anlayabildi ve geleneksel görüntü analiz yazılımının yeteneklerini aştı.
İlgili Makaleler
ChatGPT her gün yüzlerce kullanıcı kaybediyor. Ancak OpenAI endişeli değil
Meta, OpenAI Başı Belada: ABD’li Komedyen, TV Yazarları ve çeşitli yazarlar, AI bot üreticilerine içerik hırsızlığı nedeniyle dava açtı
Bununla birlikte, OpenAI, yüz tanıma söz konusu olduğunda dikkatli davranıyor. Chatbot’un görsel analiz özelliği, tanınmış bazı kişileri tanımlayabilse de, şirket, özellikle gizlilik ve izinle ilgili olarak, yüz tanıma teknolojisiyle ilgili etik ve yasal kaygıların tamamen farkındadır. Sonuç olarak OpenAI, bireylerin yüzleri hakkında Mosen’e bilgi vermeyi bırakmaya karar verdi.
OpenAI’de bir politika araştırmacısı olan Sandhini Agarwal, şirketin görsel analiz yeteneklerinin sohbet botuna entegrasyonu konusunda halkla şeffaf tartışmalara girme taahhüdünü ifade ediyor. OpenAI, net yönergeler oluşturmak ve güvenlik önlemlerini uygulamak için aktif olarak kullanıcılardan geri bildirim ve demokratik girdi ister. Ayrıca, OpenAI’nin kar amacı gütmeyen kolu, halkı yapay zeka sistemleri için kuralların tanımlanması sürecine dahil etmek, sorumlu ve etik uygulamaları sağlamak için yöntemler araştırıyor.
Görsel analizin ChatGPT’ye entegrasyonu, modelin internetten toplanan hem metin hem de resimlerden oluşan eğitim verileri dikkate alındığında doğal bir ilerlemedir. Ancak OpenAI, bu gelişmeyle birlikte gelen potansiyel zorlukların farkındadır.
Böyle bir zorluk, sistemin görüntülere yanıt olarak yanıltıcı veya yanlış bilgi üretebileceği “halüsinasyonlar” olasılığıdır. Örneğin, şöhretin eşiğindeki bir kişinin resmi sunulduğunda, chatbot yanlışlıkla farklı bir önemli figürün adını verebilir.
OpenAI’de büyük bir yatırımcı olarak Microsoft’un görsel analiz aracına da erişimi var ve şu anda Bing sohbet robotu üzerinde sınırlı testler yürütüyor. Hem OpenAI hem de Microsoft, görsel analiz özelliğinin daha geniş bir şekilde uygulanmasını düşünmeden önce, kullanıcı gizliliğini korumak ve endişeleri gidermek için dikkatli bir şekilde ilerliyor.