
Google, robotlar için optimize edilmiş Gemini Robotics’i duyurdu

Google DeepMind, Gemini, Imagen, Veo, Gemma ve AlphaFold’a yaptığı düzenli güncellemelerle yapay zeka alanında istikrarlı bir ilerleme kaydediyor. Bugün Google DeepMind ekibi, Gemini 2.0 tabanlı iki yeni modelle robotik sektörüne giriş yaptı: Gemini Robotics ve Gemini Robotics-ER.
Google DeepMind, Robotları Kontrol Etmek için Yeni Yapay Zeka Modellerini Duyurdu
Gemini Robotics, Gemini 2.0’a dayanan ve robotları kontrol etmek için yeni bir çıktı yöntemi olarak fiziksel eylemlerin eklendiği gelişmiş bir görme-dil-eylem (VLA) modelidir. Google, bu yeni modelin eğitimde daha önce hiç görmediği durumları anlayabileceğini iddia ediyor.

Google DeepMind, Robotları Kontrol Etmek için Yeni Yapay Zeka Modellerini Duyurdu
Diğer son teknoloji ürünü görme-dil-eylem modelleriyle karşılaştırıldığında Gemini Robotics, kapsamlı bir genelleme kıyaslamasında iki kat daha iyi performans göstermektedir. Gemini Robotics’in, Gemini 2.0 modeli üzerine inşa edildiğinden, farklı dillerde doğal dil anlama yeteneklerine sahiptir. Böylece, insanların komutlarını çok daha iyi bir şekilde anlayabilir.
El becerisi söz konusu olduğunda Google, Gemini Robotics’in hassas manipülasyon gerektiren son derece karmaşık, çok adımlı görevlerin üstesinden gelebileceğini iddia ediyor. Örneğin, bu model origami katlama işlemini gerçekleştirebilir veya bir atıştırmalığı Ziploc torbasına koyabilir.
Gemini Robotics-ER, uzamsal muhakemeye odaklanan ve robotikçilerin mevcut düşük seviyeli kontrolörleriyle bağlantı kurmasına olanak tanıyan gelişmiş bir görme-dili modelidir. Robotikçiler bu modeli kullanarak bir robotu kontrol etmek için algı, durum tahmini, uzamsal anlama, planlama ve kod oluşturma gibi tüm adımları kutudan çıkar çıkmaz gerçekleştirebilecekler.
Google, Gemini 2.0 modellerini temel alan insansı robotlar üretmek için Apptronik ile ortaklık kuruyor. Google ayrıca Gemini Robotics-ER’nin geleceği konusunda Agile Robots, Agility Robotics, Boston Dynamics ve Enchanted Tools gibi seçkin güvenilir testçilerle birlikte çalışıyor.
Google DeepMind, robotların karmaşık görevleri daha hassas ve uyarlanabilir bir şekilde anlamasını ve yerine getirmesini sağlayarak, robotların hayatımızın çeşitli yönlerine sorunsuz bir şekilde entegre olabileceği bir geleceğin önünü açıyor.