Ekran görüntüleri, basit çizimler veya küçük GIF’lerden başka bir şey gibi görünmemelerine rağmen memler şaşırtıcı derecede karmaşık ve anlamlı olabilir ve çoğu zaman derin felsefi içgörüler veya hayat dersleri aktarabilir.

Bu nedenle eğer şüpheniz varsa birisine memin gerçek anlamını sormak daha iyidir. “Birisi” mi dedim? Ah, demek istediğim bir şey.

Elon Musk’un xAI yaratımı olan Grok gibi bir şey. Artık Grok’un yeni bir sürümü var: Grok-1.5 Vizyon.

Bay SpaceX/Neuralink/Tesla yakın zamanda Grok-1.5’i piyasaya sürdü; bu, Google’ın geçen ay Gemini 1.5’i tanıtmasından kısa bir süre sonraydı. Musk’un xAI’si Grok-1.5 LLM’nin GPT-4’ün performansına yaklaştığını iddia etse de multimodal kapasiteden yoksundur. Ancak xAI’nin yeni duyurulan Grok-1.5 Vision’ı, hem metinsel hem de görsel bilgileri (üzerinden) sorunsuz bir şekilde işleyerek bu sınırlamanın üstesinden gelir. MSPowerKullanıcı).

Dijital ve fiziksel dünyaları birbirine bağlama

Grok-1.5 Vision (diğer adıyla Grok-1.5V), xAI’nin dijital ve fiziksel alanlar arasındaki boşluğu kapatmak için tasarlanan ilk multimodal modelini temsil ediyor. Yakın tarihli bir habere göre Blog yazısı Grok, şirket tarafından yapılan kıyaslama testlerinde üstün başarı göstererek gerçek dünyadaki üstün mekansal anlayışı ortaya koyuyor. Ayrıca Grok-1.5V, belgeler, diyagramlar, çizelgeler, ekran görüntüleri ve fotoğrafları kapsayan çok çeşitli görsel verileri yorumlama yeteneğine de sahiptir.

Grok-1.5V’nin dikkate değer bazı uygulamaları arasında diyagramlardan kod üretmek, kalori sayımlarını hesaplamak, çizimlere dayalı uyku vakti hikayeleri hazırlamak veya meme meraklılarının memleri daha iyi anlamalarına yardımcı olmak yer alıyor.

xAI, karşılaştırma testlerinde Grok-1.5V’nin Google’ın Gemini Pro gibi rakiplerinin en yeni yapay zeka ürünlerini geride bıraktığını iddia ediyor.

Grok-1.5V şu anda mevcut olmasa da, xAI bunu erken test edenler ve mevcut Grok kullanıcıları için önizleme olarak yakında yayınlamayı planlıyor.



telefon-1