DeepSeek'i, maliyeti yarıya indiren yeni dil modelini tanıttı

Çinli yapay zeka geliştiricisi DeepSeek, daha iyi eğitim ve muhakeme yeteneğine sahip olduğunu ve daha düşük maliyetle çalıştırılabildiğini belirttiği deneysel büyük dil modelini duyurdu. Hangzhou merkezli şirket, ‘seyrek dikkat’ tekniğiyle API fiyatlarını yaklaşık yarıya düşürdüğünü vurguladı.

Giriş: 30.09.2025 - 09:51
Güncelleme: 30.09.2025 - 10:02
DeepSeek'i, maliyeti yarıya indiren yeni dil modelini tanıttı

DeepSeek, pazartesi gecesi Hugging Face geliştirici forumunda yaptığı paylaşımda, deneysel büyük dil modelinin eğitim ve muhakeme kabiliyetlerini artırırken çalıştırma maliyetlerini aşağı çeken seyrek dikkat yaklaşımını kullandığını belirtti. Şirket, bu teknik sayesinde uygulama programlama arayüzü (API) fiyatlarında yarı yarıya indirime gidebildiğini ifade ediyor. API; geliştiricilerin ve şirketlerin yapay zeka modellerine kullandıkça öde mantığıyla erişmesini sağlayan çevrimiçi bir arayüz.


YILDIRIM İNDEKSLEYİCİ YENİLİK

DeepSeek’in paylaşımına göre, yeni modelin yalnızca seçili token’lara dikkat uygulayacak şekilde tasarlandığı ve bu amaçla bir ‘yıldırım indeksleyicisi’ ile ‘ince ayrıntılı token seçim mekanizması’ kullanıldığı ifade edildi. Böylece, tam dikkat matrisinin hesaplama yükü olmadan büyük girdiler üzerinde verimli çıkarım mümkün oluyor. Sektörde Google ve OpenAI gibi şirketler de benzer yaklaşımları araştırıyor. Nitekim OpenAI, 2019 tarihli bir teknik notta, tam dikkat matrisinin çok büyük girdilerde pratik olmadığını; her çıktının girdilerin bir alt kümesini dikkate aldığı seyrek desenlerin daha uygun olabileceğini vurgulamıştı.

DeepSeek'i, maliyeti yarıya indiren yeni dil modelini tanıttı


FİYAT/VERİMLİLİK DENGESİ

DeepSeek, yeni modelini ‘yeni nesil ürün yelpazesinde ilerleme’ olarak tanımlarken, API fiyatlarındaki düşüş ile çıktı kalitesi arasındaki dengeyi seyrek dikkat sayesinde yakaladığını öne sürüyor. Bu yaklaşım, modelin daha az donanım kaynağı ile benzer ya da daha iyi sonuçlar üretmesini hedefliyor.


REKABET KIZIŞIYOR

Çinli teknoloji firmaları, hem yurt içi hem de yurt dışı pazarda artan rekabet nedeniyle LLM kapasitelerini hızla yükseltiyor. Alibaba Group, geçen hafta amiral gemisi modelinin bugüne kadarki en büyük ve en yetenekli versiyonunu duyurdu. DeepSeek V3.1 ve Alibaba Qwen3 serisi, Yapay Analiz alanındaki LLM sıralamalarında OpenAI, xAI ve Anthropic gibi sağlayıcıların ardından en yüksek puanlı Çin projeleri arasında gösteriliyor.

DeepSeek'i, maliyeti yarıya indiren yeni dil modelini tanıttı


BÜYÜK DİL MODELİ ARAYÜZÜ

DeepSeek’in V3.2-Exp olarak adlandırdığı yeni deneysel sürüm, tanıtımın hemen ardından Huawei Cloud ekosistemine de girdi. Şirketin pazartesi gecesi yaptığı paylaşıma göre Huawei Cloud, DeepSeek-V3.2-Exp modelini hızla uyarlayarak kullanıma hazır hale getirdi. Bu entegrasyon, kurumsal müşteriler ve bulut geliştiricileri için model erişimini kolaylaştırıyor.


PAZARDA KONUMLANMA

DeepSeek’in, seyrek dikkat ve akıllı token seçimi ile getirdiği verimlilik vaadi, API fiyatlaması üzerinde doğrudan etkili. Şirket, yarı fiyat seviyesine çekilen API ile geliştirici tabanını genişletmeyi, deneme/uyarlama eşiğini düşürmeyi ve ürünleştirme hızını artırmayı hedefliyor


KÜRESEL EĞİLİMLERLE UYUM

Küresel ölçekte, seyrek dikkat ve verimliliğe odaklı mimari iyileştirmeler, hem model eğitiminde hem de çıkarım aşamasında donanım bağımlılığını azaltmayı hedefleyen başlıca eğilimler arasında yer alıyor. DeepSeek’in yaklaşımı, OpenAI ve Google tarafında yıllardır tartışılan verimli dikkat stratejileriyle aynı çizgide konumlanırken, Çin pazarındaki fiyat rekabetini daha da artırma potansiyeli taşıyor.DeepSeek'i, maliyeti yarıya indiren yeni dil modelini tanıttı