Yapay zeka ve donanım teknolojilerinin öncü ismi NVIDIA, robotik dünyasında kartları yeniden dağıtacak bir teknolojiye imza attı. Şirket, robotların karmaşık fiziksel görevleri yerine getirmesini sağlayan ve ‘dünya temel modelleri’ üzerine inşa edilen Cosmos Policy adlı yeni kontrol mekanizmasını duyurdu.
Geleneksel robotik sistemlerde algılama, planlama ve kontrol için ayrı modüller ve büyük miktarda etiketli veri gerekirken; NVIDIA’nın yeni yaklaşımı, önceden eğitilmiş video modellerini kullanarak süreci tek bir mimaride birleştiriyor.
VİDEO TAHMİNLERİ EYLEME DÖNÜŞÜYOR
Robotikte ‘politika’, kamera görüntüleri ve sensör verilerini fiziksel eylemlere (kavrama, hareket etme vb.) dönüştüren karar mekanizmasıdır. NVIDIA, sıfırdan bir kontrol modeli tasarlamak yerine, fiziksel dünyanın zaman içindeki değişimini analiz edebilen ‘Cosmos Predict’ adlı video dünya modelini kullanıyor.
Eğitim sonrası aşamada bu model; robot eylemlerini, fiziksel durumları ve görev sonuçlarını kendi içsel zaman akışının bir parçası olarak işliyor. Böylece robot, sadece anlık tepkiler vermekle kalmıyor, bir sonraki adımı ve bu adımın doğuracağı sonuçları tahmin edebiliyor.
DAHA AZ VERİYLE YÜKSEK VERİMLİLİK
Cosmos Policy’nin endüstriyel açıdan en dikkat çeken özelliği ‘veri verimliliği’ sağlaması. Gerçek dünya eğitim verilerinin toplanmasının son derece maliyetli ve zaman alıcı olduğu robotik sektöründe, bu yeni çerçeve büyük bir avantaj sunuyor.
Standart robotik manipülasyon testlerinde (benchmark), Cosmos Policy'nin uzun vadeli akıl yürütme gerektiren çok adımlı görevlerde yüksek başarı oranlarına ulaştığı görüldü. Bazı senaryolarda, mevcut yöntemlere kıyasla çok daha az eğitim verisi kullanılmasına rağmen üstün performans sergilendi.
STRATEJİK PLANLAMA VE GELECEĞİ ÖNGÖRME
Cosmos Policy, robotlara ‘çıkarım zamanında planlama’ yeteneği kazandırıyor.
Model, sadece bir sonraki hareketi üretmek yerine, birden fazla olası eylem dizisini simüle edip değerlendirebiliyor. Gelecekteki sonuçları ve beklenen ‘ödülleri’ tahmin eden robot, en başarılı sonuca götürecek eylemi seçerek daha stratejik davranabiliyor. İki elle manipülasyon gerektiren fiziksel deneylerde, sistemin bu yeteneği sayesinde görevleri doğrudan görsel girdi ile tamamlayabildiği kanıtlandı.
FİZİKSEL AI EKOSİSTEMİNİN TEMELİ
Bu yeni teknoloji, NVIDIA’nın makinelerin fiziksel dünyayı anlamasına ve etkileşime girmesine odaklanan geniş kapsamlı Cosmos ekosisteminin bir parçası. Hedef, göreve özgü mühendislik ihtiyacını azaltarak robotik endüstrisi için ortak ve standart bir altyapı oluşturmak.
Cosmos Policy, bir güvenlik standardı olmaktan ziyade, robot kontrolü için teknik bir temel işlevi görüyor. Robotların daha otonom hale geldiği bu yeni dönemde, yapay zeka muhakemesini fiziksel eyleme dönüştüren bu tür standartlaştırılmış katmanlar, endüstrinin geleceği için kritik önem taşıyor.