Mayıs ayında I/O geliştirici konferansında duyuruldu Google sonunda sundu İkizler burcu, ilk çok modlu yapay zeka modeli. yani metin, kod, ses, görüntü ve video dahil olmak üzere farklı bilgi türlerini anlama ve bunlar üzerinde işlem yapma yeteneğine sahiptir. Uzun zamandır gerçek bir cevap bekliyordu ChatGpt ve transformatörleri icat eden ve gelen şirket tarafından Ai Gen’e.

Blog gönderisindeki bir notta Mountain View bilim insanları, bunun aynı zamanda veri merkezlerinden mobil cihazlara kadar her cihazda çalışabilen Google AI’nın en esnek modeli olduğunu yazıyor. Üç versiyonda geliyor: Gemini Ultra, en büyük model olup son derece karmaşık görevleri yerine getirebilmektedir. Gemini Pro gelecek Ozan arama motorunda ve aile akıllı telefonlarında bile çalışabilen en verimli model olan Gemini Nano’da Piksel . Tablodan çıkan bilgilere göre en güçlüsü olan Ultra, Gpt-4’e göre üstün performansa sahip.

Gemini Ultra ve ChatGpt (ve biz insanlar) arasındaki fark

İkizler Ultra hem dünya bilgisini hem de problem çözme becerileri sorunlarını test etmek için matematik, fizik, tarih, hukuk, tıp ve etik gibi 57 konunun birleşimini kullanan MMLU’da (büyük çoklu görev dil anlayışı) insan uzmanlarından daha iyi performans gösteren ilk modeldir. Bu, sorulara cevap verdiği, metni özetlediği ve insanlardan daha iyi tercüme ettiği anlamına geliyor. Ancak, bu sistemlerin gözlemlenen bir durum hakkında makul hipotezler oluşturmayı, yani gerçeklerin en iyi açıklamasına dayanarak akıl yürütmeyi tetiklediğini, çıkarım yaptığını ancak henüz buna muktedir olmadıklarını unutmayalım. Gpt-4, terimin geleneksel anlamında multimodal değildir. Metni anlayabilen ve üretebilen ancak görüntü veya ses gibi diğer girdi türlerini doğrudan işlemeyen gelişmiş bir dil modelidir. Ancak GPT-4, çok modlu girişi işleyen diğer araç ve modellerle etkileşime girebilir. Örneğin, metin açıklamalarından görüntüler oluşturmak veya belirli uygulamalar için ses işleme sistemleriyle işbirliği yapmak için DALL-E’yi kullanabilir. Yani GPT-4’ün kendisi çok modlu olmasa da daha büyük bir çok modlu sistemin parçası olabilir. Gemini Ultra, kodlama görevlerinde performansı değerlendirmek için önde gelen bir endüstri standardı olan HumanEval ve web tabanlı bilgiler yerine yazar tarafından oluşturulan kaynakları kullanan dahili veri kümesi Natural2Code dahil olmak üzere çeşitli kodlama kriterlerinde üstünlük sağlar. Daha gelişmiş kodlama sistemleri.

İkizler burcu yeni ne yapabilir?

Gemini “takviye yoluyla” makine öğrenimine güveniyor. Yani üretken yapay zeka alanındaki duruma göre nasıl davranılması gerektiğini öğreten bir ödül ve ceza sistemi. Bu model, metni, görüntüleri, sesleri ve daha fazlasını eş zamanlı olarak tanıyıp anlayacak şekilde eğitilmiştir; böylece incelikli bilgileri daha iyi anlayabilir ve karmaşık konularla ilgili soruları yanıtlayabilir. Google, bunun, matematik ve fizik gibi karmaşık konulardaki akıl yürütmeyi açıklamayı özellikle iyi hale getirdiğini yazıyor. Gösterilen demolar çok modlu bir akıl yürütme yeteneğini ortaya koyuyor: Bu onun karmaşık yazılı ve görsel bilgileri anlamlandırabildiği anlamına geliyor. Örneğin gördüklerini bağlamsallaştırabiliyor ve karmaşık konularla ilgili soruları yanıtlayabiliyor. Bu, onu özellikle matematik ve fizik gibi karmaşık konulardaki akıl yürütmeyi açıklamada başarılı kılar.

Nasıl yapıldı?

Gemini, bir nesil tescilli hızlandırıcılar konusunda eğitildi Tensör İşleme Üniteleri (TPU’lar) V4 ve v5 Google daha güçlü, ölçeklenebilir ve verimli olarak tanımlanıyor. Bugün duyurulan bu yeni nesil TPU, en son teknolojiye sahip yapay zeka modellerini eğitmek için tasarlanan Cloud TPU v5p ile birlikte Gemini’nin gelişimini hızlandıracak ve geliştiricilerin ve kurumsal müşterilerin daha büyük ölçekli üretken yapay zeka modellerini hızlı bir şekilde eğitmesine yardımcı olacak.” Sistem, Google’ın Sorumlu Yapay Zeka ilkelerine uygundur ve önyargı ve zehirlilik de dahil olmak üzere bugüne kadar Mountain View’da yapılan tüm yapay zeka modellerinden daha kapsamlı güvenlik derecelendirmelerine sahiptir. Google, Allen Yapay Zeka Enstitüsü’ndeki uzmanlar tarafından geliştirilen, web’den alınan farklı derecelerde toksisiteye sahip 100.000 bilgi isteminden oluşan Gerçek Toksisite İstemleri gibi kıyaslamaları kullanıyor. Bu çalışmayla ilgili daha fazla ayrıntı yakında açıklanacak.



genel-18