General Intuition’ın New York ofisindeki AR-GE katına girdiğim an, şirketin 31 yaşındaki kurucu ortağı ve CEO’su Pim de Witte dikkatimi ayakta duran bir masanın üzerindeki monitöre yönlendirdi. Monitörde, Fortnite gibi bir oyunun oynandığı görülüyordu. O sırada ekranda görülen kişi bir insan değildi.
“Ajanımız tam 100 saat boyunca oyun oynadı,” diye anlattı şirketin ürün geliştirme direktörü Kent Rollins, yüzünde bir gülümseme ile.
Yapay zekanın sanal ortamda oyunu nasıl yönettiğine dalmadan, yaklaşan büyük dört ayaklı robotun elektronik ayak seslerini duydum.
“Oyunu oynayan ajanın arkasındaki yapay zeka, bu robotu da yönetiyor,” dedi de Witte.
Josh Duplantis, robotun tek kamerasından canlı yayın akışı yapan bir veri analisti olarak söz aldı ve botun varsayılan modunun “keşif” olduğunu açıkladı.
O kameraya bel bağlayan, dev böcek benzeri bot yanımda yürümeye başladı, etrafımda döndü ve ofise girdi. Ara sıra sandalyelerin ayaklarına çarpıyor veya yanlış bir yere konmuş çöp kutusuna takılıyordu; tıpkı etrafındaki dünyayı henüz öğrenmemiş küçük bir çocuk gibi. Duplantis, bunun için sadece sekiz dakikalık gerçek dünya robot veri setinin yeterli olduğunu belirtti. Üstelik bu veriler ofisin dışında, sokakta toplanmıştı.
Ajanik bir modelin oyun oynamaktan simülasyona ve bedensel deneyime genelleştirebilmesi, General Intuition’ın varoluş sebebidir. Bu modelin dünyadaki yerini bulabilme yeteneği, şirkete önemli destekler sağladı.
General Intuition, Perşembe günü 320 milyon dolarlık bir yatırım aldığını ve değerinin 2.3 milyar dolara ulaştığını duyurdu. Bu yatırım, General Intuition’ın toplam disclosed fonlama miktarını 454 milyon dolara çıkardı; geçen Ekim ayında aldığı 134 milyon dolarlık fonlama da dikkate alındığında.
Startup, oyun severlerin video oyunu kesitlerini yükleyip paylaşmasına olanak tanıyan de Witte’nin diğer şirketi Medal’dan ayrıldı. Yüz milyonlarca saatlik yüklenmiş oyun görüntüsü, General Intuition’ın mekansal-zamansal akıl yürütme modelini eğitmek için başlangıç veri setini sağladı.
Fakat anahtar unsur, bu görüntülerde yer alan eylem etiketleriydi: Bir oyuncunun hangi tuşlara ne zaman bastığını kaydeden veriler. Çoğu rakip, de Witte’nin belirttiğine göre, yalnızca videodan eylemleri çıkarmaya çalışıyor, bu da yetersiz kalıyor.
“Bunu gelecekteki ön eğitim aşamasının bir parçası olarak yeniden değerlendiriyoruz,” dedi de Witte. “Tek bir modelimiz var; Fortnite’taki verilere tepki verebiliyor ve tepkiler verebiliyor ama aynı zamanda gerçek dünya dinamiklerine de, klasik bir AI modelinin asla yapamayacağı bir şekilde yanıt verebiliyor.”
Bir noktada, de Witte, bana General Intuition’ın dünya modelini çalıştıran bir dizüstü bilgisayar verdi. Bu model, geleneksel bir oyun motoruyla render edilmek yerine kare kare oluşturulan simüle bir ortam. Genellikle dünya modellerini test ederken, duvarlara doğru yürüyordum. Diğer demolarımda, kontrol ettiğiniz ajanlar zaman zaman duvarların içinden geçiyordu, fakat bu sefer öyle olmadı. Oyun sürecinden öğrenmiş gibi davranarak duvarların duvar olduğunu, merdivenlerin tırmanmak için olduğunu ve güneş hareket ettikçe gölgelerin uzadığını anladı.
General Intuition için bu dünya modeli, ürün değil; eğitim ortamıdır (içsel olarak “salon” olarak adlandırılır). Şirket sonunda otonom modeli satmayı hedefliyor ve de Witte, oyun içindeki hareket verilerinin modelin “benlik” ile “çevre”yi ayırt etmesini sağladığını ve bu durumun sebep-sonuç ilişkisi konusunda daha zengin bir anlayış sağladığını savunuyor.
Demolarında General Intuition’ın teknolojisi etkileyici görünmesine rağmen, bu sorunu çözmeye çalışan tek şirket değil. Ayrıca, böyle bir modelin fiziksel dünyada, ölçeklendirilmiş olarak tutmasını sağlamak henüz gerçekleştirilmiş değil. Bu tür yaklaşımlar genellikle, yavaş ve pahalı bir şekilde toplanan büyük miktarda gerçek dünya verisi gerektiriyor. General Intuition, oyun oynamanın ölçeklenebilir bir kısayol sunduğuna inanıyor.
Yatırımcıları da bu denemeyi kabul ediyor. General Intuition’ın en son yatırım turunu Khosla Ventures yönetti ve General Catalyst, Jeff Bezos, Eric Schmidt, Nico Rosberg ve Google DeepMind ile MIT’deki araştırmacılar da katıldı.
Yatırımın büyük kısmı hesaplama kapasitesinin ölçeklenmesine gidecek. General Intuition, CoreWeave ile bir anlaşma yaptı ve modelin bir sonraki versiyonunu ön eğitime odaklanmayı planlıyor. Bir kısım ise yaz sonuna kadar API’sinin daha geniş bir şekilde erişilebilir olmasına ayırıldı.
Khosla, kendi firması tarafından yönlendirildiğinde, de Witte’nin vizyonundan ve şirketin özel veri pozisyonundan etkilendiğini belirtti.
“LLM’lere bakarsanız, akıl yürütme ortaya çıktığında bu bir kuantum sıçramaydı,” dedi Khosla telefon görüşmesinde. “Dünya modellerinde ise kuantum sıçraması, yapay zekanın içinde sezginin ortaya çıkmasıdır; insan benzeri bir sezgi yeteneği. Oyunlarda elde edilen insan eylem verileri ve tepki verileri, sezginin gelişiminde anahtar unsurdur.”
Vizyon: Kuşaklar Boyu Bir Şirket
General Intuition yalnızca Medal’ın insan eylem verilerinin dinamik dünya modelleri ve genel ajanslar inşa etmenin anahtarı olduğuna dikkat eden bir şirket değil. Şirketin şef ofisi Brianna Martin, Medal büyük bir laboratuvardan satın alma teklifi reddettikten sonra General Intuition’ın kurulduğunu söyledi. O zamandan beri başka teklifler de oldu.
De Witte ve kurucu ortakları Eloi Alonso, Adam Jelley ve Vincent Micheli, satın alınmakla ilgilenmiyorlar ve startup’ın yatırımcıları da kısa vadede bir çıkış arayışında değiller. General Intuition’ın Medal aracılığıyla sahip olduğu veri miktarı ve kalitesi, Khosla’nın bu startup’ın kuşaklar boyu bir yatırım olduğuna inanmasının nedenlerinden biridir; bunun simülasyon ve gerçek dünyada genel ajanslar ve dünya modelleri için temel olabilecektir.
“Bu noktada, veri edinimi ile ilgili bir satın alma olurdu ki bu tür şeyler pek ilginç değil,” dedi Khosla.
Bu tahminin bir kısmı, de Witte’nin değerlerine güvenmeyi de içeriyor.
Girişimci, insani alanda üç yıl geçirdi ve Sınır Tanımayan Doktorlar ile de çalıştı. Bu nedenle, General Intuition’ın teknolojisinin nasıl kullanılacağı konusunda net bir çizgi çizdi: İnsanlara zarar vermek için hiçbir ajan kullanılmayacak.
“Sistemin gelişen bir parçası olmak istemiyoruz,” dedi de Witte. “Diyelim ki ‘Öldürücü otonomi yapıyoruz’ diye çıksaydım. Diğer ülkelerde neler olacağını düşünüyorsun?”
Askeri kullanım durumları üzerindeki bu kısıtlama, Silikon Vadisi’nde savaş konusundaki olumlu görüşlerin arttığı bir döneme denk geliyor. Ancak de Witte, modellerinin arama ve kurtarma misyonları için kullanılmasından memnun olduğunu belirtiyor.
De Witte, Hollandalıdır ve ekibinin büyük bir kısmı Avrupalıdır; bu durum şirketin kimliğini şekillendiriyor. Martin’i, ABD Göçmenlik ve Gümrük Uygulamaları ile yaptığı iş nedeniyle Palantir’den ayrılması üzerine işe almış.
“Silikon Vadisi’nin neden böyle davrandığını anlamıyorum,” dedi. “Neden orada olmadığımın bir sebebi var.”
De Witte’nin etik anlayışı, modellerin yapmayacağı şeyleri sınırlamanın ötesine geçiyor. Gençliğinde, özel bir RuneScape sunucusu kurup işleterek 1.5 milyon dolar kazanan bir oyuncu olarak, de Witte, AI modellerinin başarısı sonucunda geride kalacak insanlarla ilgili de düşünmekte.
General Intuition, oyun severlerin mevcut sistemlerini kullanarak para kazanacağı bir iş pazarı olan Nerve adında bir platform da başlattı. Kaydolanlar veri etiketlemeye başlayabiliyor ve zamanla robot uzaktan kullanımına ve diğer görevlere geçebiliyorlar. Medal’ın kullanıcı tabanı, de Witte’nin belirttiğine göre, AI odaklı yer değiştirmeye en fazla maruz kalan nesil; bu yüzden onlara gelecek olan değişim içinde bir pay vermek istiyor.
Veri Uçturanı
De Witte, General Intuition’ın Anthropic veya OpenAI gibi bir ekosistem sağlayıcısı olmasını istiyor; böylelikle, model sağlamak ve başkalarının teknolojiyi inşa etmelerine olanak tanımak istiyor. Bugün, startup’ın oyun, simülasyon ve robotik alanlarında birkaç müşterisi var.
“Kendi sürücüsüz araç şirketimizi kurmayacağız,” dedi de Witte. “Bir sonraki kişinin bir sürücüsüz araç firması kurmasını 10 kat daha kolay hale getireceğiz.”
Şirket, API’sini daha fazla müşterinin eline ulaştırdığında, çok çeşitli kullanımlarda kendini test edebileceğini belirtiyor; örneğin, bir fabrikadaki dijital ikizinde bir robotu test ederek, oyun stüdyosundaki insan benzeri bir botu çalıştırarak veya tehlikeli ortamlarda gezinmesi için bir dört ayaklı robotu gönderebilir.
Dört ayaklı bot, General Intuition’ın gerçek dünyada denediği ilk fiziksel varlık olsa da, drone ve diğer cihazları da denemiştir; bu model, sürüş oyunları içinde de test edilmiştir.
“Oyun kumandası veya klavye fare ile kontrol edebileceğiniz her şeyde çalışıyor,” dedi de Witte.
Bir veri uçturanı inşa etme olasılığı, hedeflerinden biridir.
“Bu genel temel modelin destek sağladığı varlık çeşitlendirmesini sağlamak için müşterileri seçeceğimiz yerler,” dedi de Witte. “Gerçek dünya verilerinin araştırmaya katkı sağlayacak ilginç ve faydalı olmasını sağlayacak noktada seçeceğiz.”
Khosla, General Intuition’ın özel verisinin bu kadar ileri gitmesinin ana nedeni olduğunu ve başkalarının elinde olan verilerin toplanmasına devam etme gücünün önemli olacağını vurguladı. Özellikle etkileyici demolarına karşın, simülasyondan gerçek dünyaya geçişin ölçeklendirilebilir olup olmayacağı henüz tam olarak cevaplanmamış bir sorudur.
Düzeltme: Başlık, General Intuition’ın bu turda ne kadar kaynak topladığına dair yanlış bilgi veriyordu. Hata düzeltilmiştir.
Makalelerimizdeki bağlantılar üzerinden yapılan alımlarda küçük bir komisyon kazanıyoruz. Bu durum, editoryal bağımsızlığımızı etkilemez.


