Dünya çapındaki işletmelerin yüzde altmış altısı önümüzdeki 18 ay içinde genAI’ya yatırım yapacaklarını söyledi. IDC araştırmasına göre. 2024 yılında genAI için BT harcamalarını artıracaklarını belirten kuruluşlar arasında altyapı, toplam harcamanın %46’sını oluşturacak.
Sorun: Yapay zeka altyapısının yetersiz tedarik edildiğini ortaya çıkarmak için gerekli olan önemli bir donanım parçası. GPU’lar, genAI’nın arkasındaki en büyük büyük dil modellerini (LLM’ler) çalıştırmak için yüksek talep görse de, pazarın hala AI uygulamaları için yüksek performanslı bellek yongalarına ihtiyacı var. Piyasa şimdilik her ikisi için de kısıtlı.
LLM’lerde eğitim ve çıkarım görevleri için kullanılan GPU’lar, çok büyük miktarda işlemci döngüsü tüketebilir ve kullanımları maliyetli olabilir. Daha küçük, daha endüstri veya iş odaklı modeller genellikle iş ihtiyaçlarına göre uyarlanmış daha iyi sonuçlar sağlayabilir ve NPU’larla ortak x86 işlemcileri kullanabilirler.
Priestley, “Odak noktasının büyük kısmı yeni yapay zeka iş yükleri için yüksek performanslı GPU’ların kullanımına odaklansa da, büyük hiper ölçekleyicilerin (AWS, Google, Meta ve Microsoft) tümü yapay zeka için optimize edilmiş kendi çiplerini geliştirmeye yatırım yapıyor” dedi.
Priestley’e göre çip geliştirme pahalı olsa da, özel tasarlanmış çiplerin kullanılması operasyonel verimliliği artırabilir, kullanıcılara yapay zeka tabanlı hizmetler sunma maliyetlerini azaltabilir ve kullanıcıların yeni yapay zeka tabanlı uygulamalara erişim maliyetlerini azaltabilir.
Priestley, “Piyasa geliştirmeden dağıtıma geçerken bu eğilimin devam etmesini bekliyoruz” dedi.