Çin merkezli yapay zeka geliştiricisi DeepSeek, 15-30 Ağustos 2025 tarihleri arasında yeni nesil büyük dil modeli DeepSeek-R2’yi tanıtmayı planlıyor. Lansman penceresi, şirketin kendi yapay zeka modeliyle yapılan bir etkileşim sırasında ortaya çıktı. Bu zamanlama, ChatGPT-5’in piyasaya çıkışının hemen ardından gelerek rekabetin kızışacağını gösteriyor.
GELİŞMİŞ MİMARİ YAPISI
DeepSeek-R2, daha gelişmiş bir Uzman Karışımı (MoE) mimarisi kullanacak ve çıkarım ağırlıklı iş yüklerini optimize etmek için akıllı bir geçit ağı entegre edecek. Modelin 1.2 trilyon parametreye kadar ölçeklenebileceği belirtiliyor. Bu rakam, selefi DeepSeek-R1’in 671 milyar parametrelik kapasitesinin neredeyse iki katı. Yine de 1,8 trilyon parametreyi aşan ChatGPT-4 ve GPT-5’ten daha düşük olacak.
YERLİ ÇİP HAMLESİ
Modelin tamamı Huawei’nin Ascend 910B yongaları üzerinde eğitildi. yüzde 82 kullanım oranıyla 512 PFLOPS FP16 performansı sunan bu sistemin, Nvidia’nın A100 kümesinin yüzde 91’ine ulaştığı bildiriliyor. Analistler, bu gelişmeyi Çin’in ABD yapımı yapay zeka donanımlarına bağımlılığını azaltma yolunda stratejik bir adım olarak değerlendiriyor.
MALİYETTE BÜYÜK AVANTAJ
Yerel donanım ve optimizasyon teknikleri sayesinde DeepSeek-R2’nin eğitim maliyetinin GPT-4’e kıyasla yüzde 97 daha düşük olduğu kaydediliyor. Uzmanlar, DeepSeek’in daha uygun fiyatlı API erişimi sunarak OpenAI ve Anthropic’in fiyat politikalarını sarsabileceğini öngörüyor. Bu beklenti, Çin teknoloji hisselerinde de hareketlilik yarattı. Yapay zeka çip üreticisi Cambricon’un hisseleri yüzde 20 artarak piyasa değerini 355 milyar yuana (yaklaşık 49,7 milyar dolar) taşıdı.
HUAWEI’DEN YENİ ÇERÇEVE
Huawei, aynı dönemde Birleşik Önbellek Yöneticisi (UCM) adını verdiği yeni bir yapay zeka çıkarım çerçevesini tanıttı. UCM, KV Önbellek verilerinin HBM, DRAM ve SSD gibi farklı bellek katmanlarında işlenmesini optimize ederek model çıkarımını hızlandırıyor. China UnionPay ile yapılan testlerde gecikmede yüzde 90’a varan azalma ve verimlilikte 22 kat artış sağlandığı bildirildi. Huawei, UCM’yi Eylül ayında açık kaynaklı hale getirmeyi planlıyor.
ÇİN’İN YAPAY ZEKA STRATEJİSİ
DeepSeek-R2’nin lansmanı ve Huawei’nin UCM teknolojisi, Çin’in yapay zeka alanındaki stratejik dönüşümünün önemli göstergeleri olarak değerlendiriliyor. Bu adımlar, Batılı çiplere veya yazılım altyapılarına ihtiyaç duymadan yüksek performanslı yapay zeka sistemleri geliştirme hedefini güçlendiriyor.