Google, en geniş bağlam penceresine sahip yapay zeka (AI) modeli Gemini 1.5 Pro’yu Salı günü genel önizlemeyle tanıttı. Teknoloji devi, AI modelini ilk olarak Şubat ayında duyurdu ve sonraki iki ay boyunca geliştiricilerin denemesi için Google AI Studio’da mevcuttu. Artık kullanıcıların denemesi mümkün. Meraklılar ayrıca büyük dil modelini (LLM) kullanarak oluşturmak için API anahtarları oluşturabilir veya bunlara erişebilir. Teknoloji devi, bunu halka açarak Gemini 1.5 Pro’ya birçok yeni özellik de ekledi.

Yapay zeka modeli şuydu: tanıtıldı Şirketin yıllık Google Cloud Next etkinliği sırasında herkese açık ön izlemede. Gemini 1.5 Pro’nun standart sürümü 1.28.000 token içerik penceresiyle birlikte gelir. Karşılaştırıldığında, Gemini 1.0’ın 32.000 tokenlik bir bağlam penceresi vardı. Modelin bir milyon jetonluk devasa bir bağlam penceresiyle birlikte gelen özel bir çeşidi de var. Belirteçler, heceler, kelimeler veya kelimelerin alt bölümleri olarak anlaşılabilen birincil veri birimleridir. Bağlam penceresi, bir yapay zeka modelinin ilgili bilgileri bulmak için bilgi istemindeki anahtar kelimelere göre erişebileceği bilgi miktarıdır.

Bağlam içine koymak gerekirse, bir milyon belirteçten oluşan bir bağlam penceresi yaklaşık 7.00.000 kelime olabilir; bu, 300 sayfalık on ortalama boyutlu kitaba benzer. Bu tür bir bilgi yayılması, yapay zekanın daha geniş bağlamı anlamasına ve kullanıcıyla daha alakalı olabilecek bir yanıtla yanıt vermesine olanak tanır. Ayrıca bu yetenek, özellikle kullanıcı yapay zekanın belirli bir bilgiyi bulmak için büyük bir dosyayı analiz etmesini istediğinde kullanışlıdır.

X (eski adıyla Twitter) kullanıcısı Rowan Cheung, Gemini AI modeline erken erişim elde edebildi ve bunu kullanarak elde ettiği bulguları paylaştı. İçinde postalamak, “Dün geceki NBA smaç yarışmasının tamamını yükledim ve hangi smacın en yüksek puanı aldığını sordum. Gemini 1.5, yalnızca uzun bağlamlı video anlayışıyla spesifik mükemmel 50 smaç ve ayrıntıları bulmayı inanılmaz derecede başardı!”

AI modeli aynı zamanda birçok yeni özellik ile birlikte geliyor. Google, yerel ses veya konuşma desteği ekledi ve Gemini 1.5 Pro, sözlü komutları anlayabilir. Ayrıca, geliştiricilerin model üzerinde daha iyi kontrole sahip olabilmesi için dosyaların, sistem talimatlarının ve JSON modunun işlenmesi için bir Dosya API’si de eklendi. Aynı zamanda multimodal özelliği ile birlikte gelir ve görüntüleri ve videoları analiz edebilir. AI modeli şu anda Hindistan dahil 180’den fazla ülkede mevcuttur.


Bağlı kuruluş bağlantıları otomatik olarak oluşturulabilir; ayrıntılar için etik bildirimimize bakın.





genel-8