ChatGPT’e bir soru sorduğunuzda, isteğiniz bir veri iletim yarışını tetikler. Bilgi belleği terk eder, ön işleme için bir CPU’ya geçer, ağır hesaplamalar için bir GPU’ya yol alır ve ardından geri döner; bu süreç, yapay zekanın ürettiği her tek kelime için tekrarlanır.
Darboğazı oluşturan yapı, her istekte endüstrideki en pahalı ve enerji yoğun yongalardan bazıları üzerinden yönlendirme yapılması anlamına geliyor. İşte bu verimsizlik, Güney Kore ve ABD’de ofisleri bulunan XCENA adlı bir girişimin çözmeye çalıştığı sorundur. Dört yıllık bu girişim, hesaplama yeteneklerini DRAM’a (işlemcinin aktif olarak kullandığı verileri depolayan hızlı, kısa süreli bellek yongaları) daha yakın bir noktada toplayan bir yonga tasarladı. Bu sayede rutin veri işlemleri, CPU, GPU ve bellek arasında yapılan maliyetli gidiş gelişler olmadan belleğe yakın bir yerde işlenebiliyor.
Eğer bu, ölçeklenebilir bir yapıda işe yararsa, yapay zeka altyapı maliyetleri üzerinde önemli etkileri olabilir; bu da, ülke genelindeki yatırımcıların bu girişime olan ilgisini büyük ölçüde açıklıyor. Nitekim, XCENA, 135 milyon dolarlık bir Seri B turunda toplam değeri 570 milyon dolara çıkararak toplamda 185 milyon dolar topladı.
XCENA CEO’su Jin Kim, 2022 yılında CTO Dohun Kim ve CPO Harry Juhyun Kim ile birlikte, tümü Samsung ve SK Hynix gibi bellek devlerinde deneyimli olan kişileri bir araya getirerek bu girişimi kurdu. Kim, TechCrunch ile yaptığı röportajda şu ifadeleri kullandı: “CPU’lar ve GPU’lar on yıllar içinde akıllandı. Ancak bellek asla akıllanmadı. XCENA bu durumu değiştirmek istiyor.” Ayrıca, bellek fiyatlarındaki son artış ve ilgili hisse senedi değerleri, yapay zeka altyapısında bellek merkezli mimarilere doğru bir kaymanın olduğunu gösteriyor.
XCENA, işini “çıkarım sadece bir hesaplama problemi değil; giderek bellek ölçeklenebilirlik problemi” tezi üzerine kuruyor, diyor Kim.
XCENA’nın MX1 yongası, CPU’lara CXL (Compute Express Link) üzerinden bağlanarak, bellek modülünden çıkmadan önce veriyi işliyor. Bu sayede veriyi işlemciden uzaklaştırmadan, verinin yanında işlem yapılmasına olanak tanıyor. Şirket, daha önce 10 sunucu gerektiren bir işlemin, sadece bir sunucuda çalıştırılabileceğini iddia ediyor.
“GPU’lar, yapay zeka model eğitiminin ağır matematiğinde, matris çarpanları üzerinde mükemmel sonuçlar elde ediyor. Ancak çevresel veri orkestrasyonu, ön işleme, KV önbellek yönetimi ve veri önbellekleme gibi işlemler hala CPU’lar üzerinde çalışıyor. Bizim yongamız bu görevleri doğrudan bellek modülünün içinde gerçekleştiriyor,” dedi Kim.
Geçtiğimiz yılın ikinci yarısından bu yana bellek çözümlerine olan talep arttı ve şirket, zamanlamanın kendileri için uygun olduğunu düşünüyor.
Bir dizi global bellek satıcısıyla görüşmeler henüz erken aşamalarda, ancak Kim isim vermekten kaçındı. Şirketin ideal müşterileri, yapay zeka altyapısına yılda on milyarlarca dolar harcayan büyük ölçekli şirketler; burada bellek verimliliğindeki küçük bir artış bile yüz milyonlarca dolarlık tasarruf anlamına gelebiliyor.
MX1 henüz bir prototip. Seri üretim yongalarının 2026 yılının sonuna kadar Samsung’un fabrikalarından çıkması bekleniyor ve şirket, 2027’de gelirin başlamasını öngörüyor.
NPU üreticileri, Nvidia ile eğitim yükleri konusunda rekabet ederken, XCENA tüm bu işlemlerin altında yatan bellek yoğun katmanı hedefliyor.
XCENA’nın en yakın rakipleri arasında, gelecek nesil bellek bağlantısı alanında çalışan, Nasdaq’da işlem gören Astera Labs ve Marvell yer alıyor. Marvell, bu alanda halihazırda büyük ve köklü bir oyuncu. Kim, farklılaştırıcının fikri mülkiyetten kaynaklandığını belirtip, “Binlerce çekim var,” dedi. Kamuya açık verilere göre, Marvell’in yaklaşımı, karşılaştırıldığında bir avuç genel amaçlı çekime dayanıyor.
Bu çekirdekler, veri işlemeye özellikle optimize edilerek geliştirilmiş RISC-V açık kaynaklı yongaların tasarım şablonuna dayanıyor. Her bir çekirdek, kasıtlı olarak küçük ve verimli tutulmuştur. Çekirdeklerin yanı sıra, XCENA kendi iç bellek hiyerarşisini, bağlantı busunu ve DRAM kontrolcüsünü tasarlıyor; bu, birçok yonga şirketinin, daha büyük rakipler de dahil olmak üzere, genellikle dışarıdan temin ettiği bir düzeyde dikey entegrasyondur.
Seul merkezli VC firmaları Altinum ve IMM Investment, Seri B turunu birlikte yönetti. Girişim, Pangyo’daki bir teknoloji merkezinde ve Sunnyvale’deki ofislerinde 90’dan fazla çalışana sahip. Ayrıca, uluslararası yatırımcılarla ek finansman görüşmeleri de devam ediyor.
Makale içindeki bağlantılardan yaptığınız satın almalarda, küçük bir komisyon kazanabiliriz. Bu durum, editoryal bağımsızlığımızı etkilemez.

