Google’ın Gemini AI’si, bu yazının yazıldığı sırada yalnızca iki aydır ortalıktaydı ve şirket şimdiden Gemini 1.5 adlı yeni nesil modelini piyasaya sürüyor.
duyuru yazısı AI’daki tüm iyileştirmeleri ayrıntılı olarak açıklayarak konunun özüne giriyor. Bunların hepsi oldukça teknik, ancak ana çıkarım Gemini 1.5’in “önemli ölçüde geliştirilmiş performans” sunacağıdır. Bu, birden fazla yapay zeka modelinin birlikte çalıştığını gören bir “Uzmanlar Karması mimarisi”nin (veya kısaca MoE) uygulanmasıyla gerçekleştirildi. Bu yapının uygulanması Gemini’nin eğitilmesini kolaylaştırdı ve karmaşık görevleri eskisinden daha hızlı öğrenmesini sağladı.
Yükseltmeyi yapay zekanın üç ana sürümüne de yayma planları var, ancak bugün erken test için piyasaya sürülen tek sürüm Gemini 1.5 Pro.
Bu modeli benzersiz kılan şey, modelin “1 milyona kadar tokenden oluşan bir bağlam penceresine” sahip olmasıdır. Jetonlar, üretken yapay zeka ile ilgili oldukları için, LLM’lerin (büyük dil modelleri) “metni işlemek ve oluşturmak için” kullandığı en küçük veri parçalarıdır. Daha büyük bağlam pencereleri, yapay zekanın aynı anda daha fazla bilgiyi işlemesine olanak tanır. Ve bir milyon jeton çok büyük bir rakamdır ve GPT-4 Turbo’nun yapabileceklerinin çok üzerindedir. Karşılaştırma yapmak gerekirse, OpenAI’nin motoru 128.000 jetonluk bir bağlam penceresi sınırına sahiptir.
Gemini Pro iş başında
Tüm bu rakamlar ortadayken, soru şu: Gemini 1.5 Pro çalışırken nasıl görünüyor? Google, yapay zekanın yeteneklerini gösteren birkaç video hazırladı. Kuşkusuz, yükseltilmiş modelin büyük miktarda metni bir istem doğrultusunda nasıl analiz edip özetleyebildiğini ortaya koymaları oldukça ilginç bir şey.
Bir örnekte, Gemini 1.5 Pro’ya Apollo 11 ay misyonunun 400 sayfadan fazla metnini verdiler. Yapay zekanın belgedeki belirli ayrıntıları “anlayabildiğini, mantık yürütebildiğini ve tanımlayabildiğini” gösterdi. Yönlendirici yapay zekadan görev sırasında “komik anları” bulmasını ister. 30 saniye sonra Gemini 1.5 Pro, astronotların uzaydayken yaptığı, bunu kimin söylediği ve yapılan referansları açıklayan birkaç şaka bulmayı başardı.
Bu analiz becerileri diğer yöntemler için kullanılabilir. Başka bir demoda geliştirme ekibi yapay zekaya 44 dakikalık Buster Keaton filmi verdi. Fışkıran bir su kulesinin kaba bir taslağını yüklediler ve ardından su kulesini içeren bir sahnenin zaman damgasını istediler. Tabii ki, filmin on dakikasında tam kısmı buldu. Bunun, çizimin kendisi veya soru dışında herhangi bir metin hakkında herhangi bir açıklama yapılmadan yapıldığını unutmayın. Gemini 1.5 Pro, ekstra yardıma ihtiyaç duymadan bunun bir su kulesi olduğunu anladı.
Deneysel teknoloji
Model şu anda genel kullanıma sunulmamıştır. Şu anda Google’ın aracılığıyla “geliştiricilere ve kurumsal müşterilere” erken bir önizleme olarak sunuluyor. Yapay Zeka Stüdyosu Ve Vertex AI platformlar ücretsizdir. Şirket, test kullanıcılarını, henüz deneme aşamasında olduğundan uzun gecikme süreleri yaşayabilecekleri konusunda uyarıyor. Bununla birlikte, hattaki hızları iyileştirmeye yönelik planlar da var.
İnsanların Gemini 1.5 ve Gemini 1.5 Ultra’nın piyasaya sürülmesinin yanı sıra bu yeni nesil AI modellerinin daha geniş bir şekilde piyasaya sürülmesini ne zaman bekleyebilecekleri konusunda bilgi almak için Google’a ulaştık. Bu hikaye daha sonra güncellenecektir. O zamana kadar TechRadar’ın 2024’ün en iyi yapay zeka içerik oluşturucuları listesine göz atın.