Google DeepMind’in Yeni Modeli: Gemini Robotics On-Device
Google DeepMind, Salı günü, internet bağlantısı olmadan yerel olarak robotlar üzerinde görev gerçekleştirebilen yeni bir dil modeli olan Gemini Robotics On-Device‘i tanıttı. Bu yenilikçi model, şirketin Mart ayında piyasaya sürdüğü önceki Gemini Robotics modelinin üzerine inşa edilmiştir.
Gemini Robotics On-Device, bir robotun hareketlerini kontrol etme kapasitesine sahiptir. Geliştiriciler, doğal dil istemleri kullanarak modeli çeşitli ihtiyaçlara göre kontrol edebilir ve ince ayar yapabilirler. Bu özellik, robotların daha esnek ve işlevsel hale gelmesini sağlamaktadır.
Yerel Modelin Performans Değerlendirmeleri
Google, yeni modelin, bulut tabanlı Gemini Robotics modeli ile benzer bir performans seviyesine ulaştığını iddia etmektedir. Ayrıca, bu yerel modelin genel benchmark testlerinde diğer yerel modellere göre daha iyi sonuçlar verdiğini belirtmektedir; ancak diğer modellerin isimlerini belirtmemiştir. Bu durum, Gemini Robotics On-Device‘in, robot teknolojileri alanındaki önemi ve potansiyeli hakkında dikkat çekici bir gösterge sunmaktadır.
Robotların Yetkinlikleri: Uygulamalı Gösterimler
Google, yeni modelin uygulamalı bir demosunu sergileyerek, bu yerel modelin robotların çanta açma ve kıyafet katlama gibi görevleri başarıyla yerine getirebildiğini göstermiştir. Gemini Robotics On-Device‘in eğitim aldığı ALOHA robotları için tasarlandığı, daha sonra bi-arm Franka FR3 robotu ve Apollo insansı robota adapte edildiği belirtilmiştir.
Özellikle, bi-arm Franka FR3, daha önce “görmediği” senaryolar ve nesneler üzerinde başarılı bir şekilde görev gerçekleştirebilmiştir. Örneğin, endüstriyel bir bantta montaj yapabilme yeteneği, bu teknolojinin ne kadar etkili olduğunu gözler önüne sermektedir.
SDK ve Geliştirici Destekleri
Google DeepMind, Gemini Robotics SDK’sını da piyasaya sürmektedir. Bu SDK, geliştiricilerin robotlara 50 ila 100 görev gösterimi ile yeni görevler öğretmelerine olanak tanımaktadır. Eğitim süreci, MuJoCo fizik simülatörü kullanılarak gerçekleştirilmektedir. Bu durum, geliştiricilerin daha hızlı ve etkili bir şekilde robotlarını eğitmelerine yardımcı olmaktadır.
Robotik Alanındaki Diğer Geliştiriciler
Gemini Robotics On-Device sadece Google DeepMind’in robot teknolojisindeki inovasyonu değil, aynı zamanda diğer AI model geliştiricilerinin de robotik alana olan ilgisini gösteriyor. Nvidia, insansı robotlar için temel modeller oluşturacak bir platform geliştirmekte; Hugging Face, robotik için açık modeller ve veri setleri geliştirmenin yanı sıra, robotlar üzerinde de çalışmaktadır. Ayrıca, Mirae Asset destekli Koreli startup RLWRLD, robotlar için temel modeller oluşturma konusunda yenilikçi çalışmalar yürütmektedir.
Sonuç
Yukarıda bahsedilen gelişmeler, robot teknolojilerinin hızla evrildiğini ve bu alandaki rekabetin giderek arttığını göstermektedir. Google DeepMind gibi şirketler, bu dönüşümde öncü rol oynamakta ve kullanıcıların yaşamlarını kolaylaştıracak çözümler sunmaktadır. Gemini Robotics On-Device, yerel olarak çalışabilen bir dil modelinin sağladığı avantajlarla, robotların yeteneklerini önemli ölçüde artırmaktadır. Hem geliştiricilere sağlanan destekler hem de yenilikçi uygulamalar, bu alanda ilerlemeyi hızlandıracak ve gelecekte robotların gündelik yaşamda daha fazla yer almasına zemin hazırlayacaktır.


