Diğerlerinin yanı sıra, Mountain View geliştirme laboratuvarlarında yapay zekayı en yakından “çiğneyen” operasyonel birim olan Google DeepMind’ın CEO’su Demis Hassabis de var. BigG’nin bugüne kadar kat ettiği yolun başlangıç ​​noktası, geçtiğimiz Aralık ayında ilk yerel multimodal model olan Gemini 1.0’ın Ultra, Pro ve Nano olmak üzere üç farklı versiyondaki lansmanı oldu. Daha iyi performans ve çok modlu akıl yürütme yetenekleriyle karakterize edilen 1.5 Pro sürümü. Google tarafından hazırlanan fırlatma rampasındaki yeni özellikler menüsü artık 1.5 Pro’dan daha hafif bir model olan ve hızlı ve geniş ölçekte daha kolay dağıtılabilir olacak şekilde tasarlanan Gemini 1.5 Flash’tan oluşuyor. Daha sonra anlamlı olacak diğer yenilikler (halihazırda test edilmiş), aynı zamanda yeni bir özel mimari kullanan yeni nesil açık modeller Gemma 2 ve kullanıcıları günlük hayatta (akıllı telefon veya telefon aracılığıyla) destekleyecek yapay zeka asistanları Project Astra’dır. (akıllı gözlük) gördüklerini alma ve hatırlama, bağlamı anlama ve faaliyet gösterdikleri ortamın dinamizmini öğrenerek hareket etme konusunda son derece gelişmiş becerilere sahiptirler.

Gemini 1.5 Flash, en hızlı model

Gemini model ailesinin en son üyesidir ve Google’ın API aracılığıyla kullanılabilen en hızlı model olarak da tanımladığı şeydir: ayrıcalıkları, ayrıcalıklarına, yüksek hacimli etkinlikler için optimize edilmiş olması ve uzun bir bağlam penceresine sahip olması gerçeğini de ekler. 1.5 Pro sürümünden daha az güçlü olmasına rağmen, büyük miktarlardaki bilgiler üzerinde çok modlu muhakeme yetenekleri hala çok yüksek profillidir ve ana avantajları arasında sohbet uygulamalarında, resim ve video altyazılarında ve seçilenlerden veri çıkarmada sentez becerileri yer alır. uzun belgeler, tablolar ve daha fazlası. Bu modelin sırrı? Daha büyük bir modelin en temel bilgi ve becerilerinin daha küçük, daha verimli bir modele aktarıldığı “damıtma” adı verilen bir süreç aracılığıyla eğitilmiştir (1.5 Pro’dan beri).

1.5 Pro ve Nano Güncellemeleri

Son aylarda bağlamsal pencerenin Google’ın Nesil AI modelinin en güçlü sürümünün iki milyon jetonunu içerecek şekilde genişletilmesi hakkında zaten çok şey söylendi ve belki de 1.5 Pro’nun en son sürümünün, mantıktan başlayarak dikkatleri diğer alanlara kaydırmasının nedeni budur. görüntüleri ve videoları kodlama ve anlama. Model artık, ürün düzeyinde davranışı belirtenler de dahil olmak üzere giderek daha karmaşık ve incelikli talimatları takip etme kapasitesine sahiptir. Nihai sonuç, bir sohbet aracısının kişiliğini ve yanıt stilini oluşturmak veya birden fazla işlev çağrısında iş akışlarını otomatikleştirmek gibi belirli kullanım durumları için bu aracı kullanırken yanıtlar üzerinde daha iyi kontrol sağlamaktır.



genel-18