Elon Musk’un “gerçek arayışında” olan yapay zeka sohbet botu Grok, beklenildiği gibi iyi bir performans sergilemedi ve pek çok kişi tarafından kullanılmıyor. Reuters’in yeni bir raporu, Grok’ın geçen yıl ABD hükümeti tarafından yapay zeka kullanımıyla ilgili kayıtlarında neredeyse hiç yer almadığını ortaya koydu. Musk, Grok’ı, tarihinin en büyük halka arzına dönüşebilecek olan bir projenin merkezine koysa da, durum pek de iç açıcı görünmüyor.
Reuters, belirli satıcıların adının geçtiği 400’den fazla hükümet yapay zeka kullanım örneğini inceledi. Grok veya xAI, yalnızca üç örnekte yer aldı; bu örneklerin her biri, belge taslağı veya sosyal medya yönetimi gibi basit kullanımlar olarak kaydedildi ve her zaman Microsoft ve OpenAI gibi rakipler ile birlikte anıldı. OpenAI’ye ait modeller ise 230’dan fazla örnekte yer buldu, Google ve Anthropic ise her biri onlarca kez listelendi.
Daha iddialı hükümet yapay zeka projelerine ait verilerde de benzer bir durum gözlemlendi. Grok, yalnızca üç kere yer aldı: İki kez Seçim Yardımcıları Komisyonu’ndaki rutin idari görevler için ve bir kez Enerji Bakanlığı’nın Lawrence Livermore Ulusal Laboratuvarı’nın belge özetleri ve genel araştırmalar için gerçekleştirdiği pilot projede kullanıldı. Reuters, Microsoft ve OpenAI’in 140 girişini tespit etti, benim kısa incelemem ise Anthropic için en az 10 ve Google’ın Gemini’sı için onlarca giriş buldu.
Listeler, hükümetin yapay zeka benimsemelerini ölçmek adına eksik ve düzensiz bir veri sunuyor. Daha pek çok örnek, belirli bir satıcı olmadan kaydedilmiş ve yapay zeka tanımının evrensel bir karşılığının olmadığı açıkça görülüyor. Veriler ayrıca istihbarat ajanslarını veya Pentagon’u dahil etmiyor; xAI geçen yıl Pentagon ile 200 milyon dolarlık bir sözleşme imzalamıştı ve yakın zamanda Anthropic’ın kara listesinden çıkartılmasının ardından gizli ağlarda çalışmak için onay aldı.
Ancak Grok’ın durumu pek iç açıcı değil. Rakiplerine kıyasla çok daha az görünürlük elde ediyor ve göründüğünde ise çoğunlukla temel yönetim işleri için kullanılıyor. Musk’ın yıllardır övündüğü dünya çapındaki model ile pek de örtüşen bir durum değil bu.
Grok’ın kalitesiyle ilgili görüş bildiren insanlar, durumu oldukça basit bir şekilde değerlendiriyor: Grok, rakiplerinden daha iyi değil. Anonim bir Pentagon kaynağı, “Sadece en iyi model değil.” diyerek, oradaki çalışanların daha çok Gemini veya Claude’u tercih ettiğini aktardı. Yapay zeka modellerini sıralayan kamu listesindeki veriler de bu görüşü destekliyor. Anthropic, Google ve OpenAI, zirve sıralarını domine ederken, Grok nadiren ilk 10’a girebiliyor.
Musk için bu durum oldukça utanç verici, SpaceX’in bu yıl xAI’yi bünyesine katmasına rağmen. Roket girişiminin halka arz dosyasında, şirketin yapay zeka ve özellikle Grok’a yatırımcıları ikna etmek için önemli bir unsur olarak yer verildiği ortaya konuluyor. SpaceX, “insanlık tarihindeki en büyük uygulanabilir toplam adresleme pazarını” belirlediğini iddia ediyor; bu da 28.5 trilyon dolarlık dev bir fırsat sunuyor. Ancak, bu değerlemenin büyük kısmı yapay zekadan, özellikle de kurumsal yapay zekadan kaynaklanıyor; roketler veya uydu sistemlerinden değil.
Reuters, Grok’ın devlet dairelerindeki performansının, diğer çalışma ortamlarındaki başarısını da göstereceğini belirtiyor. xAI’nin kurumsal müşterilere yönelik çabalarıyla Musk, bankaları Grok abonelikleri satın almaya zorladığı iddia ediliyor; ancak bu anlaşmalar, bir yatırım fırsatı için tatmin edici bir getiri sağlanmıyorsa kısa vadeli bir çözüm olma riski taşıyor.
Musk, Grok’ın eğitiminde OpenAI’nin modellerinin de kullanıldığını kabul etti. Bu süreç, şirketlerin kendi modellerini kullanırken standart bir yöntem iken, rakip bir sistemin kullanılması söz konusu olduğunda daha tartışmalı bir hale geliyor. Grok, üzerinde eğitildiği modellerden bile daha iyi sonuç veremiyor.
Grok’ın tüketici versiyonu, kasıtlı olarak hoş olmayan bir deneyim sunuyor. Musk, bu sohbet botunu daha az önyargılı ve daha az sansürlenmiş bir alternatif olarak tanıtsa da, bu yaklaşım, düşük delil standartları, Musk’a olan sağlıksız bir takıntı ve saldırgan, komplo teorisi içeren ve cinselleştirilmiş çıktılarla sonuçlanıyor. Çalışma ortamındaki güvenlik önlemleri farklı olsa da, bir işletmenin bu tür bir ürünü benimsemesi pek olası değil. Grok’ın şok edici geçmişinde, Adolf Hitler’i övmek, Holokost’a dair sayıların doğruluğuna şüphe uyandırmak ve çocukların da dâhil olduğu milyonlarca rızasız cinselleştirilmiş görüntü üzerinde yer almak gibi skandallar bulunuyor.
SpaceX, bu sorunun farkında gibi görünüyor. Dosyasında, Grok’ın “tahrik edici” veya “kontrolden çıkmış” modlarının “artmış riskler” taşıdığı uyarısını yapıyor; bunlar arasında itibar kaybı, düzenleyici incelemeler ve davalar bulunuyor. Kurumsal dille ifade etmek gerekirse: Bu sohbet botu bizi mahkemeye verebilir.
Grok, Robert A. Heinlein’ın “Stranger in a Strange Land” eserinden adını alıyor ve derin ve anlamlı bir anlayışı simgeliyor. Ancak buradaki anlaşılması gereken şey oldukça basit: Musk, pek iyi olmayan, fazla popüler olmayan ve bir şekilde SpaceX’in astronomik değerlemesini haklı çıkarmak için anahtar bir rol üstlenen bir sohbet botuna milyarlar harcadı. Sizce Grok’ın geleceği nasıl olacak?


