Dün, Nvidia Research, 2024 yılı boyunca yapay zeka araştırmalarında yaşanan sayısız ilerlemeyi vurgulayan bir blog yazısı yayınladı. Bu ilerlemelerden bazıları oldukça tipik üretken yapay zeka uygulamalarıdır. Yine de bazıları, başkalarının telif hakkıyla korunan materyalleriyle içerik oluşturmaktan biraz daha ilginç; örneğin, daha gelişmiş hava durumu tahminlerine ve hareket içi boyamaya (kısmen görünür hareketten tam hareketin yeniden oluşturulması) karşılık gelen “StormCast” ve “MaskedMimic”. sırasıyla robotik için.
Ayrıca, dört yıla kadar kan şekeri seviyelerini tahmin etmek için yapay zekayı kullanan “GluFormer” da var, ancak geçmiş glikoz izleme verilerini gerektiriyor. GluFormer ayrıca diyet değişikliklerinin uzun vadeli kan şekerini nasıl etkileyeceğini belirlemeyi de kolaylaştırıyor; çalışmalar diyabet dahil olmak üzere rahatsızlıkları olan kişiler için yüksek doğruluğu gösteriyor.
Öne sürülen diğer bazı iyileştirmeler, üretken yapay zeka alanının geri kalanından biraz daha az etkileyici ve etik açıdan daha şüpheli. Ancak yine de teknolojinin gelişimini gösteriyorlar. “ConsiStory”, tutarlı bir konuya sahip birden fazla AI görüntü istemine izin vererek, bu araçlarla anlatı açısından tutarlı bir şeyler yapmaya çalışanlar için yardımcı programı geliştirir.

Bu arada, “Edify3D” ve “LATTE3D”, kolay 3D modeller oluşturmaya yönelik üretken yapay zeka araçlarıdır. Mevcut 3D modelleyiciler bunun büyük bir hayranı değil. Ancak yapay zeka retopolojisi ve UV haritalamanın, modelleri kendiniz yapmanın tüm eğlenceli ve/veya faturalandırılabilir emeğini ortadan kaldırmadan, mevcut 3D sanat iş yükleri için oldukça faydalı olacağına dikkat çekiyorlar. Ayrıca, yeni ses dosyaları (müzik dahil) oluşturmaya veya mevcut olanları değiştirmeye (arka plan müziğini kaldırmak gibi) yönelik üretken bir yapay zeka modeli olan “Fugatto” da var.
Son olarak, öne çıkan blog yazısının sonuna doğru Nvidia Research, çok sayıda iyileştirmeyi ve kıyaslama zaferini özetliyor. Bu zaferler arasında CVPR 2024’te Autonomous Grand Challenge’ı kazanan otonom sürüş çerçevesi “Hydra-MDP”, Nvidia Blackwell’in MLPerf endüstri karşılaştırmalarında lider performansı ve model tabanlı poz için BOP lider tablosunda birincilik elde eden “FoundationPose” yer alıyor. Görünmeyen nesnelerin tahmini.
Orijinal blog yazısında Nvidia, ilgili araştırma makalelerini birbirine bağlar. Bu gelişmelere ilişkin daha ayrıntılı genel bakış.

