Boston Dynamics’in ünlü Spot robot köpeği, vardiyasına sekiz saat kala kuşatılmış bir tur rehberinin tüm duygusal canlılığını toplayarak, “Şimdi ahşap kutular içine yerleştirilmiş muhteşem bir taş koleksiyonu olan kaya yığınına bakın” dedi. Boston Dynamics mühendisleri otonom robot tasarımlarıyla ünlüve en son yenilikleri, robot köpeklerine başka bir entegrasyonla kendi adına konuşma şansı verdi. SohbetGPT.

Spot, Boston Dynamics’in baş yazılım mühendisi Matt Klingensmith’e “Tur rehberi olarak çalışmam büyük memnuniyet sağlıyor” dedi. “Bilginin bu sonlandırılmasının oldukça ödüllendirici olduğunu düşünüyorum, sence de öyle değil mi?”

Boston Dynamics ekibi, Chatbot entegrasyonunun Spot ile nasıl çalıştığını gösterdi. video perşembe günü yüklendi. Büyük sarı köpek, Klingensmith ona botun aksanını sevdiğini söylemeye çalıştığında hata yapmış gibi görünüyordu. Hemen yanıt vermek yerine, “Yakın dur” diyerek tura devam etti ve bir daire çizerek döndü ve ancak o zaman mühendisin talimatına yanıt verdi. Spot daha sonra laboratuvarın dünyaca ünlü QR kod etiketlerinden oluşan diz boyu kalibrasyon panosunun bir tanımını sundu.

Chat (ro)Bot Yapmak

Boston Dynamics robotları yapabileceklerini kanıtladı dans Ve hatta parkurancak üretken yapay zeka sayesinde artık doğrudan insan girdilerini duyabiliyor ve yanıt verebiliyorlar. Botun, tüm bu taşın altında bulunması muhtemel mineraller hakkında heyecanla konuşan “değerli metal kovboy kız” da dahil olmak üzere birçok kişiliği var. Bir diğeri, “Shakespeare’ci zaman yolcusu” yalnızca kafiyeli beyitlerle yanıt veriyordu. Alaycı “Josh” kişiliği Klingensmith’e şöyle dedi: “Varlığımın akıl almaz boşluğunun bu QR kodla dolu panoya yansıdığını görüyorum… ah ve ayrıca büyük bir pencere.”

Yazılım mühendisi, ekibin yakın zamanda gerçekleşen hack-a-Thon sırasında birden fazla ChatGPT entegrasyon demosu oluşturduğunu ve “tur rehberi” fonksiyonunun görünüşe göre en ilginç uygulamalardan biri olduğunu söyledi. Spot, Boston Dynamics genel merkezi için tam bir rehber görevi görebilir ve şirketin geçmişte yaptığı botlar hakkında küçük bilgiler sunabilir. Hatta “ebeveynlerini” veya binada sergilenen eski Spot modellerini bile gösterebilir.

Bot, karargahın odalarının ve sergilerinin bir senaryosu ve haritasıyla programlandı, sonra kullanıldı. dahili kameralar ve görüntü tanıma teknolojisi etrafında olup biteni anlamak için.

Geriye kalan her şey, üstüne eklenen ses sentezleme özelliğine sahip ChatGPT API’sinden ibaretti. ChatGPT yaratıcısı OpenAI yakın zamanda ses ve görüntü tanımayı ekledi dünyaca ünlü chatbot’una. Bu sistem aynı zamanda gerçek hayattaki ses aktörlerinden sentezlenen, yapay zeka tarafından oluşturulan ses hatlarıyla kullanıcılara “konuşabilir”. Boston Dynamic’in sesi, OpenAI’nin son ekleneninden çok daha fazla bilgisayarlaştırılmıştı ve muhtemelen OpenAI’nin en son güncellemesinden önce tasarlanmıştı.

Klingensmith’e göre video, konuşan bir robotun neler yapabileceğini gösteren neşeli bir gösteriydi ancak ekip, yapay zeka abartısını biraz fazla derinlemesine araştırmış olabilir.

“Bu tür bir teknoloji, robotların yalnızca komutlarımızı yerine getirmesini değil, aynı zamanda gerçekleştirebilecekleri eylemleri ve etraflarındaki dünyanın içeriğini anlamalarını da mümkün kılabilir” dedi.

“Bir anlamda” orada çok fazla ağır iş yapıyor. Modern dil modelleri, doğal görünen bir dil üretme konusunda son derece yeteneklidir ancak hiçbir chatbot, ne yaptığını gerçekten anlayamaz veya “anlayamaz”. Ses ve görüntü tanımayla birleştiğinde ChatGPT, akıllı görünme kapasitesine sahiptir, ancak gerçekte yalnızca gerekli istemlere uyan cümleleri bir araya getirmekten ibarettir.



genel-7