Özel şirketlerin iflas oranları %9,2’yi geçerek yılların en yüksek seviyesine ulaştı. VC firması Lux Capital, yapay zekaya dayanan şirketlere, hesaplama kapasite taahhütlerini yazılı olarak onaylatmalarını önerdi. Mali istikrarsızlık AI tedarik zincirinde dalgalanmalara neden olurken, Lux, el sıkışmanın yeterli olmadığını belirtti.
Ancak tamamen dışarıdan hesaplama altyapısına bağımlılığı sona erdirmek de bir seçenek. Kullanıcıların kendi cihazlarında çalışabilen daha küçük yapay zeka modelleri, veri merkezi, bulut sağlayıcısı ya da karşı taraf riski olmadan, göz önünde bulundurulması gereken bir alternatif haline geliyor. İspanyol startup Multiverse Computing, bu alanda öne çıkıyor.
Multiverse, şu ana kadar bazı rakiplerine göre daha düşük bir profil sergiledi, ancak yapay zeka verimliliğine olan talep arttıkça bu durum değişiyor. OpenAI, Meta, DeepSeek ve Mistral AI gibi büyük AI laboratuvarlarından modelleri sıkıştırdıktan sonra, hem sıkıştırılmış modellerin yeteneklerini gösteren bir uygulama hem de geliştiricilerin bu modellerle erişim sağlamasına olanak tanıyan bir API portalı başlattı.
Multiverse’ın quantum ilhamlı sıkıştırma teknolojisiyle aynı ismi taşıyan CompactifAI uygulaması, ChatGPT veya Mistral’ın Le Chat uygulamalarına benzer bir AI sohbet aracıdır. Soru sorulduğunda, model yanıt veriyor. Fark, Multiverse’ın Gilda adını verdiği, yerel olarak ve çevrimdışı çalışabilen bir modeli entegre etmesinde yatıyor.
Son kullanıcılar için bu, verilerin cihazlarından dışarı çıkmadan ve bağlantı gerektirmeden AI deneyimine bir kapı aralıyor. Ancak bir şart var: Mobil cihazların yeterli RAM ve depolama alanına sahip olması gerekiyor. Eğer sahip değilse — birçok eski iPhone bu koşulu karşılamıyor — uygulama API üzerinden bulut tabanlı modellere geri dönecek. Multiverse, bu geçişi otomatik olarak, Tolkien hayranlarının tanıyacağı “Yüzüklerin Efendisi”ndeki Yüzük yazıtına atıfta bulunan Ash Nazg adlı bir sistemle yönetiyor. Ancak uygulama buluta geçtiğinde, ana gizlilik avantajını kaybediyor.
Bu kısıtlamalar, CompactifAI’nin henüz kitlesel müşteri kabulüne hazır olmadığını gösteriyor; bu durum belki de asla hedef olmamıştır. Sensor Tower verilerine göre, uygulamanın son bir ayda 5.000’den az indirilmesi dikkat çekiyor.
Gerçek hedef, işletmeler. Multiverse, bu gün, geliştiricilere ve işletmelere sıkıştırılmış modellere doğrudan erişim sağlayan bir özg self-servis API portalı başlatıyor — AWS Marketplace gerektirmeden.
Techcrunch etkinliği
San Francisco, CA
|
13-15 Ekim 2026
“CompactifAI API portalı geliştiricilere üretimde çalıştırılmaları için gereken şeffaflık ve kontrol ile sıkıştırılmış modellere doğrudan erişim sunuyor,” CEO Enrique Lizaso, bir açıklamada belirtti.
Gerçek zamanlı kullanım izleme, API’nin ana özelliklerinden biri ve bu tesadüf değil. Kenar bilişimin sağladığı potansiyel avantajların yanı sıra, daha düşük hesaplama maliyetleri de işletmelerin daha küçük modelleri büyük dil modellerine (LLM’ler) alternatif olarak değerlendirmesinin başlıca nedenlerinden biri.
Küçük modellerin eskisi kadar sınırlı olmaması da bir avantaj. Bu hafta Mistral, Mistral Small 4 modelinin tanıtımını yaptı. Bu model, genel sohbet, kodlama, görev ve mantıksal yürütme açısından optimize edildiğini iddia ediyor. Fransız şirket ayrıca, işletmelerin, kullanım durumlarına en iyi uyum sağlayacak trade-off’ları seçebilecekleri özel modeller oluştirmelerine olanak tanıyan Forge isimli bir sistemi de piyasaya sürdü.
Multiverse’ın son sonuçları, LLM’ler ile olan farkın daraldığını öne sürüyor. En son sıkıştırılmış modeli HyperNova 60B 2602, gpt-oss-120b tabanlı — OpenAI’nin temel kodu kamuya açık olan bir modeli. Şirket, şimdi daha hızlı yanıtlar sunduğunu iddia ediyor ve bu hız, özellikle AI’nın karmaşık, çok adımlı programlama görevlerini otonom olarak tamamladığı durumlarda önemli bir avantaj sağlıyor.
Modellerin mobil cihazlarda çalışacak kadar küçük olup aynı zamanda faydalı kalabilmesi büyük bir zorluk. Apple Intelligence, bir cihaz içi modeli ve bir bulut modelini birleştirerek bu sorunu aşarken, Multiverse’ın CompactifAI uygulaması da API aracılığıyla gpt-oss-120b’ye istekleri yönlendirebiliyor, ancak ana amacı Gilda gibi yerel modellerin maliyet tasarruflarının ötesinde avantajlara sahip olduğunu sergilemek.
Kritik alanlardaki çalışanlar için, buluta bağlanmadan yerel olarak çalışabilen bir model, daha fazla gizlilik ve dayanıklılık sunuyor. Ancak asıl değer, bunun kilidini açabileceği iş uygulamalarında yatıyor – örneğin, AI’nın dronelere, uydulara ve bağlantının garanti edilemeyeceği diğer ortamlara entegre edilmesi gibi.
Şirket, Kanada Merkez Bankası, Bosch ve Iberdrola dahil olmak üzere 100’den fazla küresel müşteriye hizmet veriyor. Ancak müşterilerini genişletmek, daha fazla finansman sağlamasına yardımcı olabilir. Geçen yıl 215 milyon dolarlık bir Seri B turu gerçekleştirdikten sonra, şimdi 500 milyon Euro değerinde yeni bir finansman turu için haberlerde yer alıyor, ve bu değerlemenin 1,5 milyar Euro’dan fazla olacağı söyleniyor.


