Bilim insanlarının her yıl yayınlanan binlerce çalışmayı takip etmesi zorlaşırken, yapay zekâ modelleri bu devasa veri setlerini süzmek için en güçlü aday olarak öne çıkıyor. Ancak bu sistemlerin karmaşık fizik problemlerinde ne kadar güvenilir olduğu büyük bir soru işaretiydi. Cornell Üniversitesi'nden Prof. Dr. Eun-Ah Kim ve Dr. Haoyu Guo liderliğindeki ekip, bu güveni test etmek için 12 uzmandan oluşan bir panel kurarak 'yüksek sıcaklık süperiletkenliği' alanını vaka çalışması olarak seçti.
ÖZELLEŞMİŞ SİSTEMLER GENEL MODELLERİ GERİDE BIRAKTI
10 Mart 2026'da Proceedings of the National Academy of Sciences (PNAS) dergisinde yayımlanan araştırmada; ChatGPT-4, Claude 3.5, Perplexity, Gemini Advanced Pro 1.5 ve Google'ın doküman odaklı ürünü NotebookLM test edildi.
GÖRSEL MUHAKEMEDE BÜYÜK EKSİKLİK
Araştırmanın en çarpıcı bulgusu, yapay zekânın 'görme' ve 'yorumlama' kabiliyetindeki zayıflık oldu. Prof. Dr. Eun-Ah Kim, modellerin metin tabanlı bilgileri çıkarma konusunda şaşırtıcı derecede iyi olduklarını ancak makalelerin kalbi sayılan veri görselleştirmelerini (grafikler, şemalar ve deney görselleri) anlamada 'tamamen yetersiz' kaldıklarını belirtti.
Bu eksiklik, mevcut modellerin henüz Genel Yapay Zeka (AGI) seviyesinde olmadığını ve bilimsel çalışmalarda insan denetiminin kritik önemini bir kez daha kanıtlıyor.
AR-GE’DE YENİ DÖNEM: GERÇEKLERDEN YARATICILIĞA
Çalışma, yapay zekânın gelecekteki gelişimine dair bir 'istek listesi' de sundu:
Prof. Dr. Kim'e göre, bu sistemlerin güvenilir hale gelmesi genç araştırmacıların önünü açacak. Eskiden 'bilimsel gerçekleri akılda tutmanın' bir giriş bileti olduğunu söyleyen Kim, "Yapay zeka sayesinde artık asıl bilet; yaratıcı düşünebilmek ve sorunlara özgün açılardan yaklaşabilmek olacak" değerlendirmesinde bulundu.