Muhtemelen yapay zekanın yapabildiğini kanıtladığı şaşırtıcı şeylerden bazılarını zaten görmüşsünüzdür – anında metin oluşturmak, Papa’ya bazı moda ipuçları vermek, herhangi bir şeyin videosunu oluşturmak veya hem programcılara hem de programcı olmayanlara yararlı kodlar sağlamak. Ancak yapay zeka tüm bunları birdenbire yapmayı öğrenmedi. Her yapay zeka aracı farklı veriler üzerinde eğitilerek temel model adı verilen modeli oluşturdu.
Daha bağdaştırılabilir terimlerle açıklamak gerekirse, bir doktor tıp fakültesine gidecek ve tıbbi prosedürler konusunda eğitim alacaktır. Bir yapay zeka doktoru için bu arka plan onların temel modeli olacaktır. Karate yapay zekası istiyorsanız doktorun antrenman verilerinin hiçbir faydası olmaz. Bunun yerine, temel modelini oluşturmak için dövüş sanatları teknikleri üzerine eğitim alacaktı. Temel modeli, büyük miktarda verinin ve bu veriler üzerinde yapılan önemli miktarda makine öğreniminin sonucudur.
Gerçek dünyadaki yapay zeka için temel modeller genellikle bir bilgisayara beslenmesi tıbbi tekniklerden veya genel müdahalelerden biraz daha kolay olan verilerden oluşur. Dil yaygın bir dildir ve temel bir model oluşturmak için yapay zeka eğitimine çok miktarda metin girer. Kodlamaya uygun temel modeller oluşturmak için metin yerine programlama dilleri de kullanılabilir. Görüntü ve ses de temel modeller için popüler olup, yeni görüntüler oluşturabilen, konuşmayı tanıyabilen veya üretebilen veya yeni müzik yaratabilen yapay zeka araçlarının oluşturulmasına olanak tanıyor.
Yine de bir temel modeli oluşturmak küçük bir başarı değildir. Yapay zekanın incelemesi gereken çok büyük miktarda verinin yanı sıra, bu verilerle devam eden makine öğreniminin üstesinden gelmek için inanılmaz miktarda bilgi işlem gücüne ihtiyaç vardır. Her yeni yapay zeka uygulaması için yeni bir model oluşturmak verimsiz olacağından, temel modelleri bu kadar önemli kılan şeylerden biri de budur. Bunun yerine popüler ve güçlü temel modelleri farklı uygulamalara uygun hale gelebilir.
Muhtemelen zaten birkaç temel modelini duymuşsunuzdur ve bunların ne olduğunu anlamamış olabilirsiniz. Stable Diffusion, yapay zeka tarafından üretilen bir sürü trend görüntünün arkasındaki temel modeldir ve Stable Diffusion XL, Stability AI’s Stable Diffusion XL (SDXL), SDXL Turbo dahil olmak üzere bir dizi farklı modele genişlemiştir.
Metin açısından Gemma, Mistral ve Llama 2 en popüler temel modellerinden bazılarıdır. Kosmos 2 gibi bazı modeller çoklu modeldir ve birden fazla veri türünü işleyerek görüntüleri ve metni anlamalarına olanak tanır.
Temel modeller, kullanıcılara oldukça uzakmış gibi görünebilir, ancak aslında bu modelleri özel donanımla çalıştırabilen daha fazla AI PC’nin yakın zamanda piyasaya sürülmesiyle erişilebilir hale geldi. NVIDIA’nın RTX GPU’ları, yapay zeka performansını hızlandırmak için özel olarak tasarlanmış Tensor Çekirdekleri ile tam da bu tür bir donanıma sahiptir.
NVIDIA’nın ChatRTX uygulaması aracılığıyla Mistral ve Llama 2 temel modellerini, içinde NVIDIA RTX donanımı bulunan Windows PC’lerde ve dizüstü bilgisayarlarda oldukça basit bir şekilde çalıştırabilirsiniz. Almayla artırılmış oluşturma (RAG) sayesinde, kendi verilerinizin bir kısmını büyük dil modeline bile besleyebilirsiniz, böylece ilgili yanıtlar sağlanabilir. Örneğin, yazdığınız bir bilimkurgu romanının notlarını ona iletebilir ve unuttuğunuzda ondan ayrıntıları isteyebilirsiniz. Model yerel olarak çalıştırıldığından ve bulut işleme için gönderilmesinde herhangi bir gecikme yaşanmadığından yanıtlar hızlıdır ve aynı şekilde, makinenizden gönderilmesi gerekmediği için verileriniz daha güvenlidir.
Temel modelleri anladığınızda, size yardımcı olacak yapay zeka uygulamalarını ararken işiniz için doğru aracı daha iyi bulabileceksiniz. Yapay zekadaki en son gelişmeler ve anlaşılması kolay açıklamalar hakkında daha fazla bilgi için şu adrese göz atın: NVIDIA’nın AI Decoded blog serisi AI araçlarına ilişkin haftalık güncellemeler ve ipuçlarını çalışırken görebileceğiniz.