ABD'li teknoloji devi Microsoft, Wisconsin ve Atlanta'daki iki büyük veri merkezini birbirine bağlayarak, yeni yapay zeka modellerinin büyük ölçekte eğitim sürecini hızlandıracak bir ‘yapay zeka süper fabrikası’ oluşturdu.
Redmond merkezli şirket, Çarşamba günü yaptığı açıklamada, "Fairwater veri merkezleri" olarak bilinen ve ortak mimariyle uyumlu bir birim olarak çalışacak şekilde tasarlanmış özel bir veri merkezi sınıfı inşa edeceğini duyurdu. Bu tesisler, aralarında kesintisiz ve hızlı bir veri akışı sağlamak için birbirine bağlıdır ve farklı coğrafyalarda bulunsalar da yapay zeka modellerini aylar yerine haftalar içinde eğitebilirler.
SANAL SÜPER BİLGİSAYAR
Microsoft'un Fairwater ağı, OpenAI ve Microsoft AI Süper Zeka Ekibi'nin operasyonel hesaplama görevlerinde gelişmiş GPU'ları kullanmasına yardımcı olmak üzere tasarlandı.
Microsoft'un Azure altyapısına odaklanan genel müdürü Alistair Speirs, bu yapının, tek bir tesiste yapılamayacak zorlukların üstesinden gelmek için "sanal bir süper bilgisayar" görevi görecek dağıtılmış bir ağ kurmakla ilgili olduğunu belirtti.

TRİLYON PARAMETRELİK GÖREV
Yapay zeka modelleri giderek büyüdükçe, her yeni nesil trilyonlarca parametreye ihtiyaç duyuyor. Bu durum, modellerin eğitilmesi için gereken bilgi işlem gücünü de hızla artırıyor ve tek bir veri merkezinin bu görevi yerine getirmesini zorlaştırıyor.
Microsoft'un Fairwater veri merkezleri, tek bir dağıtılmış sistem olarak çalışarak bu sorunu çözüyor. Her merkez, milyonlarca küçük işi yönetmek yerine, aynı devasa eğitim görevinin bir parçasına katkıda bulunuyor. Bu paylaşılan iş yükü, yüz trilyonlarca parametreye sahip modellerin eğitilmesini mümkün kılıyor.
Spiers, geleneksel bir veri merkezinin birden fazla müşteri için milyonlarca ayrı uygulamayı çalıştırmak üzere tasarlandığını belirtti. "Buraya yapay zeka süper fabrikası dememizin nedeni," diye ekledi, "milyonlarca donanım parçasında tek bir karmaşık işi yürütmesi. Ve bu, yapay zeka modelini eğiten tek bir site değil, o işi destekleyen bir site ağı."
GELİŞMİŞ SIVI SOĞUTMA
Fairwater AI veri merkezleri, yüz binlerce NVIDIA Blackwell GPU'ya ölçeklenebilen NVIDIA GB200 NVL72 raf ölçekli sistemleri kullanıyor. Veri merkezleri, daha fazla GPU yoğunluğu sağlayan iki katlı bir tasarıma ve operasyonlarında minimum su kullanımı gerektiren gelişmiş bir sıvı soğutma tesisine sahip.
Microsoft Bulut + Yapay Zeka Başkan Yardımcısı Scott Guthrie, yapay zekada liderliğin yalnızca daha fazla GPU eklemekle ilgili olmadığını, asıl meselenin bunların tek bir sistem olarak birlikte çalışmasını sağlayacak altyapıyı oluşturmak olduğunu vurguladı.
TALEP ARZI GEÇTİ
Daha fazla yapay zeka veri merkezinin planlanmasıyla birlikte Microsoft, bunları "Yapay Zeka Geniş Alan Ağı" (AI WAN) adı verilen özel fiber optik kablolar aracılığıyla birbirine bağlayacak.
Microsoft, yapay zeka tabanlı hesaplamaya olan artan talebi karşılamak için 34 milyar dolarlık sermaye harcamasının önemli bir kısmını veri merkezlerine ve GPU'lara ayırdı. Meta, Google, OpenAI ve Anthropic gibi rakipler de yeni tesislere on milyarlarca dolar yatırım yapıyor.
Bazı analistler bir "yapay zeka balonu" belirtileri görse de, Microsoft ve diğer teknoloji devleri, talebin gerçek olduğunu ve arzı çoktan geride bırakan uzun vadeli müşteri sözleşmeleriyle desteklendiğini iddia ediyor.