Yapay zeka araştırmalarında devrim niteliğinde bir gelişme yaşandı. Weizmann Bilim Enstitüsü ve Intel Laboratuvarları’ndan bilim insanları, farklı şirketler tarafından geliştirilen büyük dil modellerinin (LLM) artık birlikte çalışabilmesini sağlayan bir algoritma seti geliştirdi.
ALGORİTMA DESTEKLİ İŞ BİRLİĞİ
Geçtiğimiz hafta Kanada’nın Vancouver kentinde düzenlenen Uluslararası Makine Öğrenimi Konferansı’nda (ICML) tanıtılan bu algoritmalar, üretken yapay zekaların performansını ortalama 1,5 kat, bazı durumlarda ise 2,8 kata kadar hızlandırabiliyor. Üstelik çıktı kalitesinden ödün vermeden.
Yeni geliştirilen sistem, tıpkı insanlar gibi farklı dijital ‘diller’ konuşan yapay zeka modelleri arasında bir tür tercüman görevi görüyor. Bu sayede ChatGPT, Gemini gibi dev sistemler, kendi altyapılarına sahip daha küçük modellerle etkili biçimde iş birliği yapabiliyor.
DİJİTAL DİL ENGELİ KALKTI
Önceki sistemlerde yalnızca aynı şirketin geliştirdiği modeller bir arada çalışabiliyordu çünkü aynı dijital simge dilini kullanıyorlardı. Yeni algoritma seti, küçük modellerin çıktılarını ortak bir dijital dile çevirerek daha büyük modellerle uyumlu hale getiriyor.
Bu gelişmenin öncülerinden, Weizmann’dan araştırmacı Nadav Timor, “Başlangıçta çeviri sırasında bilgi kaybı yaşanabileceğinden endişeliydik. Ancak testler gösterdi ki, algoritmalarımız yalnızca doğru çalışmakla kalmadı, performans açısından da büyük kazançlar sağladı” dedi.
İKİ AŞAMALI ÇÖZÜM
Araştırmacılar, iki temel yöntem geliştirdi: İlki, küçük bir modelin çıktısını büyük modelin anlayabileceği simgelere dönüştüren bir dönüştürücü algoritma. İkincisi ise farklı modellerin benzer anlam taşıyan simgeleri eşleyerek daha verimli ortak çıktı üretmesini sağlıyor.
Intel Labs’tan Oren Pereg, “Yapay zekada yıllardır süren önemli bir verimsizliği giderdik. Bu yalnızca akademik bir katkı değil; geliştiriciler için somut ve uygulanabilir bir çözüm” açıklamasını yaptı.
UÇ CİHAZLARA GÜÇ
Timor’a göre, bu algoritmalar özellikle sınırlı işlem gücüne sahip uç cihazlar için kritik öneme sahip. “Telefonlar, dronlar veya otonom araçlar gibi sistemlerde, milisaniyeler bile hayati önem taşıyabilir. Bu durumda daha hızlı ve daha hafif bir model, karar verme sürecini ciddi biçimde etkileyebilir” dedi.
Ekip, algoritmalarını açık kaynaklı platform Hugging Face Transformers üzerinde yayınlayarak dünya genelindeki geliştiricilerin kullanımına sundu. Bugün, bu algoritmalar çok sayıda üretken yapay zeka projesinde standart araç haline geldi.
Üretken yapay zekaların birlikte çalışma potansiyelini açığa çıkaran bu gelişme, hem hız hem verim hem de maliyet avantajı sağlayarak yapay zekanın yaygınlaşmasında yeni bir dönemin kapısını aralıyor.