UC San Diego Halıcıoğlu Veri Bilimi Enstitüsü'nden (HDSI) Profesör Mikhail Belkin liderliğindeki araştırma ekibi, ChatGPT ve Google Gemini gibi büyük dil modellerinin (LLM) daha hassas bir biçimde yönlendirilmesine imkân tanıyan çığır açıcı bir yöntem geliştirdi. Ekip, bu çalışmayla yapay zekânın daha güvenli, güvenilir ve uyarlanabilir hale gelmesini amaçlıyor.
YAPAY ZEKADA YENİ DÖNEM
Çalışma, Science ve Proceedings of the National Academy of Sciences gibi saygın dergilerde yayımlanan önceki araştırmaların devamı niteliğinde. Araştırmaya, UC San Diego, MIT ve Harvard’dan uzmanlar katıldı. Belkin ve ekibi, “doğrusal olmayan özellik öğrenme” adlı yeni bir teknik sayesinde LLM’lerin karmaşık iç yapısındaki belirleyici ögeleri izole edip manipüle etmeyi başardı.
ZARARLI ÇIKTILAR AZALTILIYOR
Bu yöntem sayesinde araştırmacılar, LLM’lerin toksik dil kullanımı, halüsinasyon (yanlış bilgi üretimi) ve önyargılı içerik üretimi gibi zararlı eğilimlerini tespit edip bu davranışları bastıracak müdahalelerde bulunabiliyor. Sistem, iç katmanlardaki aktivasyonları analiz ederek hangi özelliklerin hangi çıktılardan sorumlu olduğunu tanımlayabiliyor.
KAYNAK VERİMİ ARTACAK
Belkin, yöntemin yalnızca güvenliği artırmakla kalmayıp aynı zamanda LLM’lerin daha az veri ve işlem gücüyle eğitilmesini mümkün kılabileceğini belirtiyor. Bu da daha erişilebilir, uygun maliyetli yapay zekâ sistemlerinin geliştirilmesinin önünü açıyor.
ÖZELLEŞMİŞ YZ UYGULAMALARI
Yeni kontrol mekanizması, yapay zekâyı belirli alanlara özel olarak uyarlama potansiyeli taşıyor. Örneğin, yalnızca doğru tıbbi bilgi sunacak şekilde optimize edilmiş bir YZ asistanı ya da önyargılardan arındırılmış yaratıcı bir yazma aracı gibi özelleştirilmiş modeller geliştirilebilecek.
TOPLUMA AÇIK KAYNAK
Ekip, geliştirdikleri yöntemi kamuya açık hale getirerek bu alanda daha fazla bilimsel keşfi teşvik etmeyi amaçlıyor. UC San Diego Bilgisayar Bilimi ve Mühendisliği Profesörü Rajesh Gupta, çalışmayı “herkes için daha güvenli ve faydalı yapay zekâ üretme yolunda atılmış önemli bir adım” olarak değerlendirdi.
Belkin ve ekibinin bu yenilikçi çalışması, yapay zekâ alanında daha etkin denetim ve yönlendirme için umut verici bir gelecek sunuyor.