X (eski adıyla Twitter) Premium aboneleri artık Grok AI asistanından görüntüleri oluşturmasını değil tanımlamasını da isteyebilir. Elon Musk’a ait xAI şirketi, görsel içerik analizi için fotoğrafları, diyagramları ve diğer anlık görüntüleri tanımlama yeteneği sağlayan yeni bir özelliği açıkladı. Grok-2 Yapay zeka sohbet robotuna ve Flux yapay zeka görüntüsü oluşturmaya güç veren yapay zeka modeli.
Bu özellik Grok’u ChatGPT, Gemini ve diğer rakiplerle aynı seviyeye getiriyor. X’in abonelik planlarına abone olursanız, X içindeki bir görsel gönderisindeki bir düğmeye tıklayarak ve görsel hakkında Grok’a sorular sorarak veya yalnızca doğrudan tanımlayıcı bir analiz için bunu şimdi deneyebilirsiniz.
Yeni özelliğe paralel olarak Grok, RealWorldQA adı verilen ve bir modelin, nesneler arasındaki boşluk da dahil olmak üzere gerçek dünya görüntüsünü ne kadar iyi tanımlayabildiğini göstermesi beklenen yeni bir kriteri gösterdi. Şirket, RealWorldQA’nın Grok’un, henüz geliştirilme aşamasında olmasına rağmen görüntüleri açıklama konusunda rakipleri kadar iyi veya onlardan daha iyi olduğunu gösterdiğini iddia ediyor. Aşağıda nasıl çalıştığına dair bir örnek görebilirsiniz, Paylaşıldı Elon Musk tarafından X hakkında.
Grok artık görüntüleri anlıyor, hatta şakanın anlamını açıklıyor. Bu daha erken bir versiyon. Hızla iyileşecektir. https://t.co/gQ5BBISVRc28 Ekim 2024
Bkz ve Grok
Ekran görüntüsünün de gösterdiği gibi Grok, karmaşık, çok aşamalı bir görüntüyü parçalama ve içinde ne olduğunu açıklama yeteneğine sahiptir. Daha sonra şakanın mizahını tahmin edebilir, ancak neredeyse her zaman olduğu gibi şakayı açıklamak onu daha az komik hale getirir. Yine de bu, xAI’nin Grok için yeni özellikler, özellikle de çok modlu araçlar sunma işini bitirmediğinin bir işareti. Bu, Grok’un ses ve video içeriğini görsellerle aynı şekilde açıklayabilmesine yönelik bir adım olabilir.
Bahsedilmeyen unsurlardan biri, Grok’un görsel analizinin, telif hakkı sorunları konusunda çok az pişmanlık duyan veya hiç pişmanlık duymayan yapay zeka sohbet robotunun serbest görüntü oluşturma sürecini nasıl tasvir edebileceğidir. Bu, Mario’nun resimlerini yapan kullanıcıların, Nintendo’nun telif hakkı ihlali avcısı Tracer’ın ihlal nedeniyle onların peşine düşmesiyle karşılaştığı bir şeydi. Mario’nun yapay zeka görüntüsünün veya başka herhangi bir fikri mülkiyetin bu şekilde mi yoksa daha genel terimlerle mi tanımlanacağını keşfetmek ilginç olacaktır.
xAI’nin sahibi kendisi olduğundan, bu özelliğin Musk’a ait diğer teknoloji şirketlerinde de çok açık bir potansiyeli var. Tesla’nın yarı otonom sürüşü, etrafındaki insanları, nesneleri ve bunların birbirlerinden nasıl uzak durduklarını tanımlayabilmesinden kesinlikle faydalanacaktır. Aynı şey Tesla’nın uzun süredir vaat ettiği ve son birkaç yıldır geliştirilmekte olan insansı robotları için de geçerli.