
Meta, birkaç yıl önce maliyetleri azaltmak ve NVIDIA’ya olan güvenini azaltmak için AI çıkarımı için RISC-V tabanlı yongalarını inşa eden ilk şirketlerden biriydi. Reuters Şirketin bir adım daha ileri gittiğini ve yapay zeka eğitimi için şirket içi hızlandırıcısını tasarladığını (muhtemelen Broadcom’un yardımıyla) tasarladığını bildiriyor. Çip Meta’nın hedeflerini karşılıyorsa, ileri büyük dil modellerini eğitmek için H100/H200 ve B100/B200 gibi üst düzey NVIDIA AI GPU’lara olan güvenini azaltabilir.
Meta ve Broadcom, Meta’nın TSMC ile ilk AI eğitim hızlandırıcısını bantladı; Rapora göre, ikincisi bu yongaların ilk çalışan örneklerini üretti ve ortaklar birimi başarıyla gündeme getirdi. Şimdiye kadar Meta, hızlandırıcının sınırlı bir şekilde konuşlandırılmasıyla başladı ve üretimi ve dağıtımını ölçeklendirmeden önce performansını değerlendirdi. Meta’nın mühendislerinin yeni çipte kriterler çalıştırıp çalışmadığı belirsizdir; Zaten bazı yararlı işler yapmak için konuşlandırıldı.
Çipin özellikleri bilinmemektedir, ancak tipik olarak AI eğitim yongaları sistolik dizi olarak bilinen bir tasarım kullanır. Bu mimari, satırlarda ve sütunlarda düzenlenmiş aynı işleme elemanlarının (PES) yapılandırılmış bir ağından oluşur. Her birim, matrisleri veya vektörleri içeren hesaplamaları işler ve veri ağ üzerinden sırayla akar.
AI için Özel RISC-V Hızlandırıcı
İşlemci AI eğitimi için tasarlandığından – bu, büyük miktarda veri işlemek anlamına gelir – işlemcinin HBM3 veya HBM3E belleğine sahip olmasını bekleyin. Ismarlama bir işlemci ile uğraştığımızı düşünürsek, Meta desteklenen veri formatlarını ve kalıp boyutunu, güç tüketimini ve performansı optimize etmek için talimatlarını tanımladı. Performansa gelince, hızlandırıcı, NVIDIA’nın H200, B200 ve muhtemelen yeni nesil B300 gibi güncel AI GPU’ları ile WATT başına rekabetçi performans sunmalıdır.
CHIP, Meta’nın Meta Eğitim ve Çıkarım Hızlandırıcı (MTIA) programına en son ektir. Program, geliştirmenin benzer aşamalarda durdurulduğu zaman da dahil olmak üzere çeşitli aksiliklerle karşılaştı.
Örneğin, sınırlı dağıtım testleri sırasında performans ve güç hedeflerini karşılayamadıktan sonra dahili çıkarım işlemcisini durdurdu. Bu başarısızlık, Meta’nın 2022’de stratejisini değiştirmesine yol açarak NVIDIA GPU’ların hemen AI işleme gereksinimlerini karşılaması için büyük siparişler vermiştir.
O zamandan beri Meta, on binlerce GPU edinerek Nvidia’nın en büyük müşterilerinden biri haline geldi. Bu birimler, öneriler, reklamlar ve Llama Vakfı Model Serisi için AI modellerinin eğitiminde kritik öneme sahiptir. Ayrıca, Reuters’e göre, Green Company’nin GPU’ları, Meta platformlarında günlük üç milyardan fazla kullanıcı için etkileşimleri destekleyerek çıkarım süreçleri için kullanıldı.
Bu zorluklara rağmen, Meta özel silikon programını ilerletmeye devam etti. Geçen yıl, Meta çıkarım görevleri için bir MTIA çipini kullanmaya başladı ve ileriye baktığımızda, Meta’nın liderliği 2026 yılına kadar AI eğitimi için özel yongalarını kullanmaya başlama planlarını özetledi. Plan, Meta’nın veri merkezi işleri için daha özelleştirilmiş donanım çözümleri tasarlamak için uzun vadeli hedeflerin kritik bir bileşeni olan performansı ve güç hedeflerini karşılıyorsa kullanımı kademeli olarak artırmaktır.
Dikkat edilmesi gereken ilginç bir şey, MTIA’nın çıkarım için hızlandırıcılarının açık kaynaklı RISC-V çekirdeklerini kullanmasıdır. Bu, Meta’nın talimat seti mimarisini, gereksinimlerini kadansında karşılamak istediği için özelleştirmesini sağlar, ancak öte yandan, herhangi bir üçüncü tarafa telif ücreti ödemesine gerek yoktur. MTIA’nın eğitim hızlandırıcısının RISC-V ISA’ya da dayanmadığı belirsizdir, ancak bu mümkündür. Bu doğruysa, Meta endüstrinin en yüksek performans gösteren RISC-V tabanlı yongalarından birini geliştirmiş olabilir.

