Geçtiğimiz hafta sızdırılan bilgilerle gündeme oturan DeepSeek V4, 24 Nisan 2026 itibarıyla resmi olarak yayımlandı ve doğrudan açık ağırlıklı modeller liginin zirvesine yerleşti. Üstelik şirket bir değil iki versiyonla geldi: amiral gemisi V4 Pro ve maliyet odaklı üretim için V4 Flash. Performans rakamları ve fiyat etiketi düşünüldüğünde, kurumsal AI pazarında dengeleri ciddi biçimde sarsacak bir lansman.
İki Versiyon, Bir Mimari
DeepSeek V4 ailesi iki modelle geliyor:
- V4 Pro: 1,6 trilyon toplam parametre, 49 milyar aktif parametre
- V4 Flash: 284 milyar toplam parametre, 13 milyar aktif parametre
Her iki model de 1 milyon token bağlam penceresi sunuyor — bu V3.2’nin 128K limitinin tam 8 katı. Lisans ise MIT, yani açık ağırlıklar dünyasında en izin verici lisanslardan biri. Modaliteler şimdilik metin girişi/çıkışı ile sınırlı.
Mimaride Yenilik: CSA + HCA Hibrit Attention
V4’ün asıl teknik atılımı, attention mekanizmasında. Model, Compressed Sparse Attention (CSA) ve Heavily Compressed Attention (HCA)‘yı birleştiren hibrit bir yapı kullanıyor. Bu mimari, uzun bağlamda verimliliği dramatik şekilde iyileştiriyor.
1 milyon token bağlam ayarında DeepSeek-V4-Pro, V3.2’ye göre tek-token çıkarımı için sadece yüzde 27 FLOP ve yüzde 10 KV cache kullanıyor. Yani uzun bağlamda hem hesaplama hem bellek açısından muazzam bir verim kazancı.
Benchmark Performansı
Benchmark sonuçları V4’ün ne kadar ciddi bir iddiada bulunduğunu gösteriyor:
- SWE-bench Verified: V4 Pro %80,6 — Claude Opus 4.6’nın %80,8’inin sadece 0,2 puan gerisinde
- Codeforces: 3.206 puanla GPT-5.4’ün 3.168’ini geçti; lansman tarihinde herhangi bir modelin elde ettiği en yüksek competitive programming skoru
- Intelligence Index (Artificial Analysis): V4 Pro 52, V4 Flash 47 — V4 Pro açık ağırlıklı modeller arasında Kimi K2.6’nın ardından #2
- Agentic Performance (GDPval): V4 Pro 1554, V4 Flash 1388
- Hallucination: V4 Pro önceki sürüme göre 11 puanlık iyileşme gösteriyor
Fiyat: Pazarı Yıkacak Seviyede Düşük
DeepSeek’in en büyük silahı yine fiyat oldu. V4 Pro fiyatlandırması:
- Input: 1 milyon token başına 0,145 dolar
- Output: 1 milyon token başına 1,74 dolar
Bu rakamlar, GPT-5.5 veya Claude Opus 4.7 gibi rakiplerden yaklaşık 7 kat daha ucuz input ve 6 kat daha ucuz output anlamına geliyor.
V4 Flash ise daha da agresif: 1M input tokenı 0,14 dolar, 1M output tokenı sadece 0,28 dolar. Bu fiyatla Claude Sonnet 4.6 seviyesinde performans veren bir modele erişmek, kurumsal AI ekonomisini kökten değiştirebilir.
Açık Ağırlıklar ve Erişim
Her iki model de Hugging Face üzerinden açık ağırlıklı olarak indirilebiliyor. DeepSeek API üzerinden de doğrudan kullanım mümkün. vLLM 0.20 sürümü ise modele “day-one” desteği getirdi — yani lokal kurulumda da V4 hemen çalıştırılabiliyor.
Çin’in AI Bağımsızlığı Stratejisinde Bir Adım Daha
Daha önce sızan bilgilerde de değinildiği gibi, V4’ün Huawei çipleri üzerinde de yüksek performans verecek şekilde tasarlandığı belirtiliyor. Bu, ABD’nin çip ihracat kısıtlamalarının yarattığı baskıya rağmen Çin’in yapay zeka cephesinde önemli bir mevzi koruduğunu gösteriyor.
Açık ağırlıklı, ucuz, performansı zirveye yakın ve Çin altyapısında çalışabiliyor — bu kombinasyon, kapalı kaynak frontier modellerinin kurumsal pazardaki üstünlüğünü ciddi biçimde tehdit ediyor.
Sonuç
DeepSeek V4 Pro, açık ağırlıklı dünyada Claude Opus ve GPT-5 sınıfı bir modelin 7 kat daha ucuza sunulabileceğini kanıtladı. V4 Flash ise Claude Sonnet seviyesi performansı uçuk derecede düşük fiyata getirdi. Önümüzdeki dönemde kurumsal AI bütçeleri ve frontier model fiyatlandırması üzerindeki etkisini hep birlikte göreceğiz.
Kısacası: Açık ağırlıklar yarışı yeni bir liderle açıldı ve frontier modellerin “premium”unu korumak giderek zorlaşıyor.
Kaynak: Artificial Analysis | DeepSeek API Docs

Bir yanıt yazın