Nvidia, yapay zeka alanında çip tedarik eden şirketlere büyük bir kazanç sağlamışken, bugün önemli bir adım atarak kendisini daha ciddi bir model üreticisi olarak konumlandırdı. Şirket, mühendislerin bu modelleri kullanabilmesi için veriler ve araçlarla desteklenen gelişmiş açık modeller serisini piyasaya sürdü.
Açık Modellerin Önemi
Nvidia’nın bu hamlesi, OpenAI, Google ve Anthropic gibi şirketlerin kendi çiplerini daha yetenekli hale getirdiği bir dönemde gerçekleşti. Bu durum, bu firmaların zamanla Nvidia’nın teknolojisinden uzaklaşmasına karşı bir önlem niteliği taşıyor. Açık modeller, araştırmacılar ve girişimciler için prototip oluşturma ve deney yapma süreçlerinin vazgeçilmez bir parçası. Öte yandan, OpenAI ve Google küçük açık modeller sunmasına rağmen, bu modelleri Çinli rakipleri kadar sık güncellemiyor.
Nemotron 3 ile Yenilikçi Bir Adım
Nvidia’nın yeni modeli Nemotron 3, indirilebilir, değiştirilebilir ve kendi donanımınızda çalıştırılabilir en iyi modeller arasında yer alıyor. Şirketin yayımladığı benchmark skorlarına göre, bu modellerin performansı oldukça etkileyici. CEO Jensen Huang, “Açık inovasyon, yapay zeka ilerlemesinin temelidir,” diyerek, Nemotron ile gelişmiş yapay zekayı geliştiricilerin şeffaflık ve verimlilikle büyük ölçekli sistemler inşa edebileceği bir açık platforma dönüştürdüklerini ifade etti.
Şeffaflık ve Özelleştirme Araçları
Nvidia, Nemotron’u eğitmek için kullanılan verileri paylaşarak, birçok ABD rakibine kıyasla daha şeffaf bir yaklaşım benimsiyor. Bu sayede mühendislerin modelleri daha kolay değiştirebilmeleri sağlanıyor. Ayrıca, Nvidia’nın sunduğu araçlar, özelleştirme ve ince ayar yapma süreçlerini destekliyor. Hybrid latent mixture-of-experts modeli gibi yeni mimari yapılar, bilgisayarlar veya web üzerinde eylem alabilen yapay zeka ajanları oluşturmak için oldukça uygun.
Model Büyüklükleri ve Parametreler
Nemotron 3 modelleri, üç farklı boyutta sunuluyor: Nano, 30 milyar parametreye; Super, 100 milyar parametreye; Ultra ise 500 milyar parametreye sahip. Bir modelin parametre sayısı, onun ne kadar yetenekli olduğunu ve çalıştırılmasının ne kadar zor olduğunu belirliyor. En büyük modeller, yüksek maliyetli donanım gerektirdiğinden, büyük sunucu raflarında çalıştırılmak zorunda kalıyor.
Açık Modellerin Geleceği
Nvidia’nın generatif yapay zeka yazılımları başkan yardımcısı Kari Ann Briski, açık modellerin önemini üç ana maddeyle özetliyor: İlk olarak, geliştiricilerin belirli görevler için modelleri özelleştirmesi gerekli. İkincisi, farklı modellere sorguların yönlendirilmesi fayda sağlıyor. Üçüncüsü ise, bu modellerin simüle edilmiş akıl yürütme performansıyla daha akıllı yanıtlar vermesini sağlamak mümkün. Briski, “Açık kaynak, yapay zeka inovasyonunun temelidir ve küresel ekonomiyi hızlandırmaya devam edecektir,” dedi.
Meta gibi sosyal medya devleri, Şubat 2023’te Llama adıyla ilk gelişmiş açık modelleri piyasaya sürdü. Ancak rekabetin artmasıyla birlikte Meta’nın gelecekteki sürümlerinin açık kaynak olmayabileceği sinyallerini verdi. Bu durum, yapay zeka endüstrisinde daha geniş bir trendin parçası olarak görülebilir; son bir yılda ABD firmaları açık kaynaklı araştırmalardan uzaklaşıp daha gizli bir yaklaşım benimsiyor.
Teknoloji
US-1

