Sinir ağları, ilk Üretken Ön Eğitimli Transformatörlerin yinelenmesinden bu yana son yıllarda önemli ölçüde büyüdü. NVIDIA en son grafik kartlarını ve Tensor Çekirdeklerini geliştirdikçe, bu ağların yetenekleri son yıllarda büyük ölçüde geliştirildi. Geleneksel olarak yalnızca metin tabanlı girişler olan NVIDIA, derin öğrenme ve ses yorumlama için TensorRT’den yararlanıyor. GDC 2024’te Inworld AI teknolojisinin kullanıldığı iki ayrı uygulamalı gösteride, hem Ubisoft’un NEO NPC’lerini hem de NVIDIA’nın Gizli Protokolünü deneme ve dönüştürme fırsatı bulduk.

Son on yılda katıldığım Dungeons & Dragons oturumunu destekleyen herhangi bir DM’ye sorun: eğlencenin olduğu yer, kampanyanın (ve ahlakın) sınırlarını zorlama fırsatını değerlendirmektir. Her iki demo da bana her iki deneyimi de neredeyse tamamen sesle kontrol etme özgürlüğü verdi; bu arada, yöneticim kenarda oturuyor, muhtemelen notlar alıyor ya da başını sallıyor ve fişi çekip çekmeyeceğimi tartışıyordu. Sonunda Ubisoft’un NEO NPC programını önceden görebildiğimde, sabah 10:00’dan önce ikinci fincan kahvem üzerinde çalışıyordum ve şimdiden PG-13 dereceli yaratıcılıkla dolu bir yazı tipiyle doluydum.

Ubisoft Paris’in Inworld gösterimi için, Inworld’ün Yapay Zeka Karakter Motoru ile NVIDIA’nın Audio2Face otomatik yüz animasyonlarının bir kombinasyonunu uygulamalı olarak denedim. Seansım boyunca moda olan “gerçeklik” kelimesi birkaç kez ortaya çıktı ve çoğunlukla doğruydu, çünkü korkuluklar benim “direniş”e benim bir şekilde “direniş”e dahil edildiğim yanılsamasını sürdürmek için yerindeydi. Bloom adında bere takan bir şehirli.

Inworld AI deneyimini oyunlaştırmak için Ubisoft, mega şirketler veya Bloom hakkında bilgi edinmek ve bütünsel düzeyde direniş hakkında bilgi edinmek gibi, yapılması önerilen etkinliklerin açılır bir listesini tuttu. Ne zaman konuşmayı görmeye çalışsam, Bloom bu görünmez engelleri gündeme getiriyor, isteğimin mizahi yönüne dair anlayışlı küçük bir espri yapıyor ve sonra hemen geri dönüp onu direniş konusunda sorguya çekmemi sağlamaya çalışıyordu. Gösteri boyunca hareketlerimde, daha doğrusu sözlerimde büyük bir ısrar var. Benzersiz becerilerim sorulduğunda, kendimi Nelson yerine Poncho olarak bilinmeyi tercih eden bir barista ve kripto tutkunu olarak yetiştirdim. Bloom bunu kabul etmekten fazlasıyla memnundu ve demonun amacına dair bir fikir edinmek yönündeki nihai hedefim sona ermeden önce bazı anekdotları karşılıklı olarak paylaştık.

Demonun ikinci kısmı, direnişteki kadın liderlerden biri olan ve Bloom’u önemli ölçüde geride bırakmış görünen Iron ile daha çok serbest biçimli bir beyin fırtınası oturumuna geçti. İkinci seferdeki görevim kasaya girme yöntemlerini tartışmaktı. Bir denetleyici alıp sanal brifing odasında dolaşırken, Ubisoft’un açıkça gündeme getirmemi ve brunch’tan sonra hafif bir B&E çözümü için Iron ile işbirliği yapmamı istediği listeler ve anahtar kelimelerle karşılaştım.

Aletler önümde olmasına rağmen onları daha yaratıcı şekillerde bir araya getirmeye çalıştım. Merdiven, ikinci kattaki bir binaya tırmanmanın ve girmenin bariz bir yoluydu, ama neden o merdiveni yanıma alıp koridordaki güvenlik kamerasına tırmanmak ve binanın çekilmiş bir Polaroid fotoğrafını asmak için kullanmıyordum? Koridoru kamerayı kandırıp geçmeme izin vermek için mi koruyordu? Beni giriş balkonundan ofise geçmekten alıkoyan bir korumayı bayıltmak, Metal Gear Solid oyununu oynayan biri için başlı başına yeterince basit bir olaydı, ama niyeti sesli komutlarla nasıl aktarırsınız? Iron, bir pompalı tüfeğin iş kısmına bir kıskaç kancası takma isteklerimi basitçe omuz silkerdi ya da bir karton kutunun içine tırmanma ve şiddet içermeyen bir direniş biçimi olarak eski standarda uyma ve gizlice geçmeyi tercih ederdi. Hayır, sesli itirazlarıma rağmen gardiyanı etkisiz hale getirecek bir çözüm bulmadan bir sonraki adıma geçemezdim. Bütün o boktan işlerim ve boşa harcadığım zamanım yüzünden, ofise girip vaat edilen değerli istihbaratı almak için nihai bir çözüm bulamadan sessizce demodan atıldım.

NVIDIA’nın Gizli Protokol demosu çok daha az yönlendirmeli bir deneyimdi ve o oturumun arka planı, ilgili kişinin beş yıldızlı bir otelde kaldığı oda numarasını keşfetmekti. Benim kapak hikayem mi? Serbest bırakılması için doğrudan imza gerektiren bazı yasa dışı malları taşıyan kurye. Etkileşime girdiğim ilk Dünya İçi NPC olan komi, önerilerime Bloom ya da Iron’dan çok daha uygun görünüyordu. Konuşmaları çok daha tepkisel olsa da, görevim tamamlandıktan sonra ayak masajı yaptırmam ya da onu karaokeye davet etmem yönündeki önerilere açık görünüyordu. Ne yazık ki yapay zekayı bazı şov şarkılarını anında çalmaya ikna edemedim ama o bana eski karaoke yedek parçasının Psy’nin mega hiti ‘Gangnam Style’ olduğunu söyledi. Bir yaratıcılık kıvılcımıyla, saçımı kestirdiğinde ona biraz kızmaya özen gösterdim ve ona kel olduğumu ve herhangi bir stil gezisine ihtiyacım olmadığını söyledim. Konuşmamı bitirip otelin giriş kapısına doğru yürüdüm ve tam resepsiyona adım atmak üzereyken, camdan bronzlaşmış bir yüzün bana baktığını gördüm; üstü iyice parlatılmıştı; kesinlikle en ufak bir paspas kafası değil. İkinci kez oynayacak zamanım olsaydı, oyuncunun tepkilerine bağlı olarak oyuncu karakterinin gerçekten tatlı kilitlerle donatılıp donatılmayacağını veya her demonun kel ve güzel bir beyefendi olarak mı başlayacağını merak ederdim.

Diğer iki AI NPC’nin yanıtları çok daha az şekillendirilebilirdi ve ikisi de hikayeye dışarıdan birine günün saatini vermek istemiyor gibi görünüyordu. Bu, bir tarafa uygun bir şekilde yerleştirilmiş bir çalışma rozeti bulana kadardı. Bunu envanterime aldıktan sonra, her iki yapay zekanın kişilikleri aslında benim amaçlanan isteklerimi dinliyor ve aslında bana amaçlanan hedefime yönelik değerli bilgiler sağlıyor gibiydi. Ters dönen bu anahtar, oyunun içine girme hissini biraz bozdu ve oynanışla ilgili nedenlerden dolayı evet, oyuncunun sadece hava durumu veya en sevdiği şampuan tatları hakkında ileri geri konuşmak yerine etkileşime geçebileceği hedeflerin olması gerektiğini anlasam da, bu çok zaman aldı. Serbest biçimli oyun vaadinden ziyade, rol yapma duygusundan uzak, ayrı hedeflere zorlanma.

İsteğim ne kadar saçma olursa olsun, soruları PG-13’te tuttuğum ve gerçekten müstehcen herhangi bir şeyden kaçındığım sürece, dil modelleri isteklerimi kabul edecek ve genellikle esprili ve anlayışlı yanıtlarla yanıt verecekti. Bu karakterlerin ve dil modellerinin deneyiminin kalitesi, sonuçta eğitim aldıkları konu ve olağandışı istekleri çözecek işlem gücü kadar iyidir. Ubisoft ve NVIDIA’nın her biri, gelecekte oyunlara entegrasyonda faydalı olabilecek korkulukları yerinde tutarken, oyuncuyla gerçekçi bir sohbet oluşturmak için farklı yollara sahip olduklarını gösterdi. Mevcut konsol nesli sona ermeden bu araçların gerçekten oyunlara entegre edilip edilemeyeceği henüz bilinmiyor. Yine de şüpheciliğim şimdilik azaldı ve bu yapay zeka destekli NPC’ler için geleceğin neler getirebileceğini görmek ilgimi çekti.

Bu hikayeyi paylaş

Facebook

heyecan



genel-17