Yapay zekada ezberleme ve akıl yürütme ayrıştırıldı

Yapay zeka girişimi Goodfire.ai, GPT-5 gibi dil modellerinde ezberleme ve mantıksal akıl yürütmenin tamamen ayrı sinir yollarında çalıştığını keşfetti. Ezberleme yolları silindiğinde, modelin mantığı bozulmazken, matematik yeteneğini de kaybettiği ortaya çıktı.

Giriş: 12.11.2025 - 17:26
Güncelleme: 12.11.2025 - 17:26
Yapay zekada ezberleme ve akıl yürütme ayrıştırıldı

Mühendisler, GPT-5 gibi yapay zeka dil modellerini eğittiklerinde, iki önemli işlev ortaya çıkar: daha önce gördükleri metinleri (alıntılar, pasajlar) birebir tekrarlama, yani ezberleme; ve genel prensipleri kullanarak yeni problemleri çözme, yani muhakeme. Yapay zeka girişimi Goodfire.ai'nin yeni araştırması, bu farklı işlevlerin modelin mimarisinde tamamen ayrı sinir yolları üzerinden çalıştığına dair ilk net kanıtı sundu.


Araştırmacılar, bu ayrımın son derece net olduğunu keşfetti. Ekim ayı sonlarında yayınlanan bir ön baskı makalesinde, ezberleme yollarını kaldırdıklarında, modellerin eğitim verilerini birebir kopyalama becerilerinin yüzde 97'sini kaybettiğini, ancak ‘mantıksal akıl yürütme’ becerilerinin neredeyse tamamını koruduğunu açıkladılar.


MEKANİK AYRIŞMA TESPİT EDİLDİ

Örneğin, Allen Yapay Zeka Enstitüsü'nün OLMo-7B dil modelindeki belirli bir katmanda, bazı sinir ağı bileşenlerinin ezberlenmiş verilerde çok daha yüksek aktivasyon gösterdiği, diğer bir kısmının ise genel, ezberlenmemiş metinlerde daha aktif olduğu görüldü. Bu mekanik ayrım, araştırmacıların diğer yetenekleri korurken ezberlemeyi cerrahi olarak ortadan kaldırmalarına olanak sağladı.


MATEMATİĞİ DE EZBERLİYORMUŞ

Belki de en şaşırtıcı bulgu, aritmetik işlemlerin mantıksal akıl yürütme yerine ezberlemeyle aynı sinir yollarını paylaşması oldu. Ezberleme devreleri çıkarıldığında, matematiksel performans yüzde 66 oranında düşerken mantıksal görevler neredeyse hiç değişmedi.


Bu keşif, yapay zeka dil modellerinin harici araçlar olmadan matematikte neden bu kadar zorlandığını açıklayabilir. Tıpkı çarpım tablosunu ezberlemiş ama çarpmanın nasıl çalıştığını hiç öğrenmemiş bir öğrenci gibi, yapay zeka modellerinin de aritmetiği hesaplamak yerine sınırlı bir ezber tablosundan hatırlamaya çalıştığı anlaşıldı. Bulgular, mevcut dil modellerinin ‘2+2=4’ ifadesini mantıksal bir işlemden ziyade ezberlenmiş bir olgu gibi ele aldığını gösteriyor.


AKIL YÜRÜTME FARKLILIĞI

Yapay zeka araştırmalarındaki ‘akıl yürütme’ yeteneğinin, insanlardaki akıl yürütme ile tam olarak örtüşmediğini belirtmek gerekiyor. Bu çalışmada korunan mantıksal akıl yürütme, doğru/yanlış ifadeleri değerlendirme ve eğer-ise kurallarını takip etme gibi görevleri içeriyor; bu da özünde öğrenilmiş kalıpları yeni girdilere uygulamak anlamına geliyor.


TELİF HAKKI İÇİN UMUT

İleriye dönük olarak, bu bilgi kaldırma teknikleri geliştirilirse, yapay zeka şirketleri bir gün telif hakkıyla korunan içerikleri, özel bilgileri veya zararlı ezberlenmiş metinleri, modelin genel görev yeteneğini bozmadan sinir ağından kaldırabilir.

Yapay zekada ezberleme ve akıl yürütme ayrıştırıldı


Ancak araştırmacılar, sinir ağlarının bilgileri henüz tam olarak anlaşılmamış dağıtık yollarla depoladığı için, yöntemlerinin "hassas bilgilerin tamamen ortadan kaldırılmasını garanti edemeyeceğini" belirtiyorlar. Bu çalışmaların, yapay zeka için yeni bir araştırma yönünde atılan ilk adımlar olduğu vurgulandı.


BİLİMSEL ARKA PLAN

Araştırmacılar, bu ayrımı yapabilmek için yapay zekanın ‘kayıp manzarası’ adı verilen bir kavramı analiz etti. Basitçe, bir modelin tahminlerinin ne kadar yanlış veya doğru olduğunu görselleştirmenin bir yolu olan bu manzarada, ezberlenmiş bilgilerin ‘keskin sivri uçlar’ oluşturduğu, akıl yürütme yeteneklerinin ise ‘yuvarlanan tepeler’ gibi daha tutarlı, orta düzeyde eğriler oluşturduğu tespit edildi.


K-FAC adı verilen bir teknik kullanarak bu düşük eğrilikli (ezber) bileşenlerini seçici olarak çıkaran ekip, ezberlenen içeriğin yaklaşık yüzde 100'den yüzde 3,4'e düştüğünü gördü. Bu sırada, mantıksal akıl yürütme görevleri yüzde 95 ila yüzde 106 arasında performansını korudu. Ancak matematik ve kapalı kitap bilgi hatırlama (CEO isimleri gibi nadir bilgiler) ezberlemeyle aynı yolları paylaştığı için ciddi oranda düşüş gösterdi.