Son zamanlarda Microsoft’tan araştırmacılar, görüntüleri analiz edebilen, üzerlerindeki metni bulup tanıyabilen, görsel bulmacaları çözebilen, görsel IQ testleri yapabilen ve doğal dil komutlarını anlayabilen bir yapay zeka modeli olan Kosmos-1’i tanıttı. Bu sistemin çeşitli giriş modlarını birleştirebileceği söyleniyor: metin, resim, video, ses vb. Bu, bir insandan daha kötü olmayan bir dizi sorunu çözebilecek bir “yapay genel zeka” (AGI) yaratacaktır.
Bu yapay zekaya çok modlu denir (daha doğrusu, çok modlu bir büyük dil modeli veya MLLM’dir) ve bazı uzmanların inandığı gibi, yapay zekanın entelektüel çözmede insanların yerini almasına izin verecek bir teknoloji olan “genel yapay zeka” nın temeli olabilir. problemler. Böylece son zamanlarda popüler hale gelen chatbot’lara ve büyük dil modellerine (LLM’ler) bir alternatif olacaktır. Microsoft’un önemli AI ortaklarından biri olan OpenAI’nin AGI oluşturmak istediğini ve hatta bunun için güvenlik önlemleri geliştirdiğini unutmayın.
Kosmos-1’e gelince, bu sistem OpenAI’nin katılımı olmadan oluşturulmuş gibi görünüyor. Öncelikle metinle çalışır ve görüntüleri bir dizi özel belirteç olarak algılar.
Microsoft, Kosmos-1’i 800 GB’ın üzerinde İngilizce metin içeren Internet 1 verilerini kullanarak eğitti. Yeni sistemin modern dil modellerini geride bıraktığı söyleniyor. Bununla birlikte, şimdilik Microsoft’un sözüne güvenmeye devam ediyor – şirket henüz kaynak kodlarını yayınlamadı.