Kendini eğiten yapay zeka: DiscoRL, insan mühendisleri solladı

Araştırmacılar, kendi öğrenme kuralını sıfırdan icat eden bir yapay zeka geliştirdi. ‘DiscoRL’ adlı sistem, klasik Atari oyunlarından karmaşık dijital ortamlara kadar birçok görevde insan mühendislerin tasarladığı algoritmalardan daha başarılı sonuçlar elde etti.

Giriş: 23.10.2025 - 17:55
Güncelleme: 23.10.2025 - 17:55
Kendini eğiten yapay zeka: DiscoRL, insan mühendisleri solladı

Yapay zeka sistemleri, insanlar gibi deneme yanılma yoluyla öğrenir. Ancak şimdiye kadar bu süreç, insanların tasarladığı algoritmalara dayanıyordu. Yeni geliştirilen DiscoRL sistemi ise bu zinciri kırarak kendi öğrenme yöntemini geliştirmeyi başardı. Araştırma ekibi, rastgele denemelere dayalı evrimsel bir yaklaşım kullanarak binlerce dijital ‘ajan’ın farklı görevleri çözmesini sağladı. Bu ajanları denetleyen bir ‘meta ağ’, ajanların başarı düzeylerini analiz ederek öğrenme kurallarını sürekli geliştirdi. Böylece sistem, zaman içinde kendi öğrenme stratejisini evrimleştirdi.


YENİ NESİL YAPAY ZEKA

Süreç sonunda ortaya çıkan Disco57 adlı üst seviye model, insan eliyle yazılmış en gelişmiş algoritmalardan biri olan PPO ve MuZero’yu dahi geride bıraktı. Araştırmacılar, sistemi önce 57 klasik Atari oyunu üzerinde test etti. Ardından ProcGen, Crafter ve NetHack gibi daha önce karşılaşmadığı ortamlarda denemeler gerçekleştirdi. DiscoRL, hem bilinen hem de bilinmeyen görevlerde üstün performans sergileyerek kendi öğrenme kuralını optimize etti.


ALGORİTMALARIN SONU MU?

DiscoRL’nin başarısı, yapay zeka geliştirme sürecinde insan müdahalesinin azalabileceğini gösteriyor. Nature dergisinde yayımlanan makalede, araştırmacılar şu değerlendirmeyi yaptı: “Gelişmiş yapay zeka sistemleri için gerekli olan takviyeli öğrenme algoritmaları, artık elle tasarlanmadan, ajanların deneyimlerinden otomatik olarak keşfedilebilir. Bu çalışma, insan eliyle yazılan yöntemlerle rekabet eden, hatta onları geride bırakan sistemlere giden yolu açıyor.”


GELECEĞİN KENDİ ÖĞRENEN SİSTEMLERİ

Bu gelişme, yapay zekanın yalnızca öğrenen değil, ‘nasıl öğreneceğini öğrenen’ bir yapıya evrildiğini ortaya koyuyor. Uzmanlar, bu tür sistemlerin gelecekte ilaç keşfinden otonom sistemlere, yazılım optimizasyonundan robotik kontrolüne kadar çok geniş alanlarda devrim yaratabileceğini öngörüyor.