Amazon’un Yapay Zeka Benchmark’larının Önemsiz Olduğu Vurgusu
Amazon’un yapay zeka alanındaki yüksek mertebedeki yöneticileri, özellikle yapay zeka performans değerlendirmeleri ve liderlik tablolarına dayanarak yapılan kıyaslamalara karşı net bir duruş sergiledi. Amazon’un AGI SVP’si Rohit Prasad, bu konuda şunları vurguladı: “Gerçek dünyada fayda istiyoruz. Bu benchmark’ların hiçbiri gerçek değil.”
Benchmarkların Geçerliliği
Prasad, mevcut değerlendirmelerin genellikle gürültülü olduğunu ve bu yüzden modellerin gerçek gücünü yansıtmadığını ifade etti. AI laboratuvarlarının, yeni modellerini liderlik tablolarında rakiplerine karşı daha yukarı taşıma konusundaki hırsları, Amazon’un bu önerisine zıt bir tutum sergilemekte. Amazon’un Nova modeli ise şu an 79. sıradadır, bu da firmanın benchmark noktalarında kendisini daha iyi gösterme isteğini sorgulatıyor.
Nova Forge: Özel Modelleri Kolaylaştırma
AWS re:Invent etkinliğinde Amazon’un tanıttığı en önemli yenilik Nova Forge, şirketlerin daha önce milyarlarca dolara mal olacak şekilde özelleştirilmiş AI modelleri eğitmelerini sağlamaktadır. Şirketler, kapalı bir modeli ince ayar yapmanın yanı sıra, açık-kaynak modellerde eğitim yapmanın risklerinden kaçınabilir. Nova Forge, Amazon’un Nova model kontrol noktalarına erişim sağlayarak, özel verileri modelin öğrenme kapasitesinin en yüksek olduğu aşamalarda entegre etmesine olanak tanır.
Maliyetlerin Demokratikleştirilmesi
“Ne yaptığımız, AI’yi ve öncü model gelişimini sizin kullanım durumlarınıza göre çok daha uygun maliyetle demokratikleştirmek,” diyor Prasad. Forge’un geliştirilmesindeki temel neden, Amazon’un iç ekipleriydi. Bu ekipler, sıfırdan inşa etmeden alan uzmanlıklarını modelin temeline ekleyebilecekleri bir araç istediler.
Reddit Örneği: Spesifik Ürünler Üzerine Yapılan Çalışmalar
Reddit, Nova Forge’un sağladığı imkanlarla topluluk moderasyon verilerine dayalı özel güvenlik modelleri inşa etmektedir. Reddit’in CTO’su Chris Slowe, bu deneyimi “şimdiye kadar gördüğüm en iyisi” olarak tanımlıyor. Hedefleri, bir dizi özel güvenlik modelini, topluluk moderasyonunu anlaması için optimize edilmiş tek bir modelle değiştirmek.
Kontrol ve Özelleştirme Üzerine Vurgu
Novus ve Azure gibi diğer modellerle yapılan karşılaştırmalardan kaçınmak için, Amazon kontrol ve özelleştirme üzerine yoğunlaşmak istiyor. Slowe, Nova’nın benchmark’ta üst sıralarda olmamasının önemli olmadığını, asıl önemli olanın modelin Reddit’e özgü uzmanlığının olduğunu belirtiyor.
Sonuç: Yeni Bir Yönelim
Amazon’un AI stratejisi, gereksinimlerin özelleştirilmesine ve gerçek dünya faydası sağlamaya odaklanmış durumda. Forge ile, Amazon, yüzeysellikten kaçınarak, AI modellerinin gerçek dünya faydasına sunulmasını sağlayacaktır. Bu strateji, bir noktada Amazon’un model katmanında doğrudan karşılaştırmalardan kaçınmasını sağlıyor. Eğer Forge, geliştirici adoption ile gerçekten yenilikçi olursa, AI modellerinin başarı ölçümü, geleneksel benchmark’ların ötesine geçecek ve gerçek dünyadaki faydaları esas alacaktır.


