Anasayfa / Popüler Bilim / Google’dan robotlara “akıl” kazandıran yeni yapay zeka modelini sergiledi

Google’dan robotlara “akıl” kazandıran yeni yapay zeka modelini sergiledi

Google, robotların fiziksel dünyayı yalnızca algılayan değil, aynı zamanda anlayan ve yorumlayan sistemler haline gelmesini hedefleyen yeni yapay zeka modelini duyurdu. Gemini Robotics-ER 1.6 adı verilen model, robotların komutları uygulayan makineler olmanın ötesine geçerek çevresel bağlamı kavrayabilmesini ve bağımsız kararlar alabilmesini sağlıyor.

Şirketin “bedensel akıl yürütme” (embodied reasoning) yaklaşımı üzerine inşa ettiği bu model, robotların görsel verileri analiz etmesini, görev planlaması yapmasını ve bir işlemin başarıyla tamamlanıp tamamlanmadığını değerlendirmesini mümkün kılıyor. Böylece robotlar yalnızca verilen talimatları izleyen sistemler yerine gerçek dünya koşullarına uyum sağlayabilen otonom ajanlara dönüşüyor.

Haberi okuduğunuz için teşekkürler, bizi takip etmeyi unutmayın!

Fiziksel dünya ile dijital zeka arasındaki boşluk kapanıyor

Gemini Robotics-ER 1.6’nın en dikkat çekici gelişmelerinden biri uzamsal akıl yürütme (spatial reasoning) yeteneklerindeki ciddi iyileştirme oldu. Model nesneleri tanıyabiliyor, sayabiliyor ve aralarındaki ilişkileri daha yüksek doğrulukla analiz edebiliyor. Ayrıca “işaretleme” (pointing) yeteneği sayesinde sahnedeki önemli noktaları belirleyerek karmaşık görevleri daha küçük adımlara ayırabiliyor.

Bu özellik, özellikle karmaşık ve dağınık ortamlarda çalışan robotlar için kritik önem taşıyor. Robotlar artık yalnızca nesneleri görmekle kalmıyor, hangi nesnenin nerede olduğunu, nasıl taşınacağını ve hangi sırayla işlem yapılacağını da anlayabiliyor.

Model aynı zamanda görev tamamlanma tespiti (success detection) konusunda da önemli bir sıçrama sunuyor. Robotlar, bir işlemin doğru şekilde bitip bitmediğini analiz edebiliyor. Bu da özellikle otomasyon süreçlerinde sistemin tekrar denemesi mi gerektiğine yoksa bir sonraki adıma mı geçmesi gerektiğine karar vermesini sağlıyor.

Çoklu kamera verisini tek bir anlamlı tabloya dönüştürüyor

Modern robot sistemlerinde genellikle birden fazla kamera bulunuyor. Üstten görüş ve robot koluna yerleştirilmiş kameralar gibi farklı açılardan gelen verilerin birleşimi, doğru analiz için büyük önem taşıyor. Gemini Robotics-ER 1.6, çoklu görüntü akıl yürütme yeteneğiyle bu verileri tek bir bütün halinde yorumlayabiliyor. Bu sayede model, görüşün kısıtlı olduğu ya da nesnelerin birbirini engellediği durumlarda bile çevreyi daha doğru analiz edebiliyor.

Modelin en pratik yeniliklerinden biri ise endüstriyel cihazları okuyabilme yeteneği oldu. Basınç göstergeleri, termometreler, sıvı seviye göstergeleri ve dijital ekranlar gibi ekipmanlar artık robotlar tarafından doğrudan analiz edilebiliyor.

Bu özellik, Boston Dynamics ile yapılan iş birliği kapsamında geliştirildi. Özellikle Spot robotunun tesis denetimlerinde kullanılması sırasında ortaya çıkan ihtiyaçlar, bu yeteneğin geliştirilmesinde belirleyici oldu.

Model, cihaz okuma işlemini gerçekleştirirken yalnızca görüntü analizi yapmıyor. “Agentic vision” adı verilen yaklaşım sayesinde görsel akıl yürütmeyi kod çalıştırma ile birleştiriyor. Örneğin bir basınç göstergesini analiz ederken önce görüntüyü yakınlaştırıyor, ibre ve işaretleri tespit ediyor, ardından matematiksel hesaplamalarla değeri yüksek doğrulukla belirliyor.

Bu alanda önceki modellerde yaklaşık yüzde 23 seviyesinde olan doğruluk oranı yeni modelde yüzde 93’e kadar yükselmiş durumda.

Geliştiricilere açıldı

Gemini Robotics-ER 1.6 yalnızca daha akıllı değil, aynı zamanda daha güvenli bir sistem olarak öne çıkıyor. Model, tehlikeli durumları algılama ve fiziksel güvenlik kurallarına uyma konusunda geliştirilmiş yeteneklere sahip. Hem metin hem de görsel senaryolarda riskleri tanımlayarak hatalı işlemleri önleyebiliyor.

Yeni model, bugünden itibaren Gemini API ve Google AI Studio üzerinden geliştiricilerin kullanımına sunulmuş durumda. Ayrıca, modelin nasıl kullanılacağını gösteren örneklerin yer aldığı bir Colab ortamı da paylaşıldı.

Etiketlendi:

Cevap bırakın

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir