Z.ai'den GLM-5.2: ABD Fable 5 Yasağına Çin Yanıtı — 744B Parametreli MIT Lisanslı Frontier Model, 1M Context, GPT-5.5'in 1/6 Maliyeti

13 Haziran 2026, yapay zeka tarihinin en sembolik günlerinden biri olarak kayıtlara geçecek. Aynı gün, iki şey aynı anda oldu:

ABD Ticaret Bakanlığı, Anthropic’in Claude Fable 5 ve Mythos 5 modellerine ABD vatandaşı olmayanların erişimini kısıtladı.
Çinli AI laboratuvarı Z.ai (eski Zhipu AI), 744 milyar parametreli frontier modeli GLM-5.2’yi MIT lisansıyla, herkese tamamen ücretsiz olarak yayınladı.

Bu rastlantı değil. Bu, açık ağırlık ekosistemiyle kapalı kaynak ekosistemi arasındaki gerilimin somut bir kırılma anı — Pekin’in Washington’a verdiği jeopolitik bir cevap. Z.ai’ın ana şirketi Knowledge Atlas Technology’nin Hong Kong borsasındaki hisseleri ertesi gün %30’dan fazla prim yaptı. OpenRouter’da en çok kullanılan modeller listesinin ilk dördü artık tamamen Çinli modeller: DeepSeek, MiniMax, Tencent ve Xiaomi.

Bu yazıda GLM-5.2’nin teknik içeriğine ve neden bu kadar önemli olduğuna bakacağız.

Önce jeopolitik kontekst: Anthropic ne oldu?

9 Haziran’da Anthropic Claude Fable 5’i yayınladığında biz de detaylı bir yazıyla anlatmıştık: SWE-Bench Pro’da %80.3, FrontierCode Diamond’da %29.3 ile dünyanın en güçlü kamu modeli. Stripe’ın 50M satırlık Ruby migration’ını bir günde yapmış. Mythos-class olarak adlandırılan yeni bir kategori.

13 Haziran’da, lansmandan sadece 4 gün sonra, Beyaz Saray Mythos-class modelleri yeni bir regülasyon kategorisi olarak sınıflandırdı — ve ABD vatandaşı olmayanların bu modellere erişimini Ticaret Bakanlığı kararıyla yasakladı. Anthropic, Amazon CEO Andy Jassy’nin Beyaz Saray görüşmelerinden sonra bu karara uydu.

Tepki Çin’den geldi. Z.ai aynı gün GLM-5.2’yi yayınladı. Mesaj net: “Siz kapatırsanız biz açarız.”

GLM-5.2: teknik özellikler

Modelin mimari profili:

Toplam parametre: 744 milyar.
Aktif parametre (her token): 40 milyar.
Mimari: Mixture-of-Experts (MoE).
Context window: 1 milyon token (kullanılabilir).
Max output: 131.072 token.
Düşünme seviyeleri: İki seviye — High ve Max.
Lisans: MIT — bölge kısıtlaması yok, sınır yok, ticari kullanım için bedava.
Bonus: FP8 quantize edilmiş versiyon da yayınlandı (zai-org/GLM-5.2-FP8).

MIT lisansı vurgusu kasıtlı: Apache 2.0’dan bile daha permissive. Cohere’in North Mini Code’u gibi “Apache 2.0 + Acceptable Use Policy” ek şartı yok; saf MIT, dilediğiniz gibi kullanırsınız.

IndexShare: yeni bir mimari yenilik

GLM-5.2’nin asıl teknik atılımı IndexShare adlı sparse attention sistemi. Önceki sparse attention yaklaşımları (Native Sparse Attention, DeepSeek MLA gibi) her transformer katmanında ayrı indekslemegerektiriyordu. IndexShare bunu farklı yapıyor:

4 katmanda bir indexer. Her 4 transformer katmanı aynı hafif indekserı paylaşıyor. İndeks, 4 katmanlı bloğun ilk katmanında hesaplanıyor; top-k indeksler kalan 3 katmanda yeniden kullanılıyor. Bu şu pratik faydayı sağlıyor:

%75 daha az indekser hesaplaması. 4 katmandan 3’ünde indekser ve top-k operasyonu atlanıyor.
1M context’te 2.9 kat daha az per-token FLOPs.
Aynı kalite. Z.ai’nın iddiası, kalite kaybı olmadan bu hızlanmayı sağladıkları.

Bunun pratik anlamı: 1 milyon token context’e sahip bir modeli daha düşük donanım maliyetiyle servis edebilirsiniz. Bu, MIT lisansla birleştiğinde self-hosted deployment’ı pratik kılan unsur.

Bir başka iyileştirme: MTP (Multi-Token Prediction) katmanı yeniden tasarlanmış. Speculative decoding’de kabul edilen tahmin uzunluğu (acceptance length) %20’ye kadar artmış. Bu, inference hızını doğrudan artıran bir mühendislik kazanımı.

Benchmark’lar: GPT-5.5 ile yarışıyor, hatta bazılarında geçiyor

Z.ai başlangıçta benchmark’ları lansman gününde paylaşmadı — sadece “güçlü kodlama, güçlü long-horizon” gibi pazarlama ifadeleri kullandı. Bu farklı bir tavırdı; rakip lansmanlarda ilk gün ayrıntılı tablo paylaşılır. Sonraki günlerde gerçek veriler ortaya çıktı.

Kodlama:

SWE-Bench Pro: 62.1 — GPT-5.5’in 58.6’sını geçiyor. (Opus 4.8’in 69.2’si önde.)
FrontierSWE: %74.4 — GPT-5.5’in %72.6’sını geçiyor.
Terminal-Bench 2.1: 81.0 — GLM-5.1’in 62.0’sından 19 puan sıçrama. “Best Reported Harness” konfigürasyonunda 82.7’ye çıkıyor; bu da Opus 4.8’in 78.9’unu geçiyor.

Tasarım ve web geliştirme:

DesignArena Web Dev Non-Agentic Composite: Elo 1.360 ile #1. Claude Fable 5 (1.350) ve Opus 4.6/4.7 ailesinin önünde.

Matematik ve reasoning:

AIME (agentic-math): 99.2 — Opus 4.8’in 95.7’sini geçiyor.

Yani GLM-5.2 her metrikte lider değil, ama özellikle web geliştirme + terminal görevler + agentic matematik üçgeninde dünyanın en üst seviye modellerinin önünde.

Fiyat: GPT-5.5’in 1/6’sı

Z.ai API üzerinden GLM-5.2’yi servis ediyor — ama asıl nokta self-hosted seçeneği. MIT lisansla model ağırlıklarını indirip kendi GPU’nuzda çalıştırabilirsiniz.

VentureBeat’in karşılaştırmasına göre, eşdeğer iş yükü için GLM-5.2 API maliyeti GPT-5.5’in yaklaşık altıda biri. Bu, uzun horizon coding görevlerinde — tipik bir Claude Code session’ı 200K-1M token aralığında olduğu için — aylık operasyonel maliyetlerde dramatik fark yaratıyor.

Donanım gereksinimi: 744B modelin gerçeği

744 milyar parametreli bir model, BF16 precision’da yaklaşık 1,5 TB VRAM ister. FP8 quantize edilse bile 750 GB civarı. Yani kişisel kullanım için pratik değil; multi-GPU sunucu kümesi gerekiyor.

Tipik self-hosting konfigürasyonları:

8x H200 (141 GB): FP8 quantize ile rahat. Üretim-grade tek nod.
8x H100 (80 GB): FP8 ile sınırlı; layerwise offload ile mümkün ama daha yavaş.
4x B200: Blackwell mimarisi, en güncel donanım. Production deployment için ideal.
Cloud GPU: SiliconFlow, Together AI, Fireworks ve OpenRouter zaten GLM-5.2’yi servis ediyor.

40B aktif parametre olduğu için inference hızı, 100B’lik bir dense modele göre çok daha iyi. IndexShare ile bu hız 1M context’te bile sürdürülebilir.

Pazarın tepkisi: OpenRouter top 4’te Çinli modeller

Anthropic erişim kısıtlaması sonrası geliştirici davranışı çok hızlı değişti. OpenRouter’da haftalık en çok kullanılan modeller listesinin ilk dördü şu an:

DeepSeek-V4-Pro
MiniMax M3
Tencent Hunyuan
Xiaomi MiMo

GLM-5.2 zaten hızla yükseliyor; haftalardır beklenen yeni modelin ücretsiz API ile erişilebilir olması (OpenRouter free tier) etkisini hemen gösterdi.

Knowledge Atlas Technology’nin (Z.ai’nın ana şirketi) Hong Kong borsasındaki hisseleri lansman ertesi günü %30+ prim yaptı. Bu, Çinli açık ağırlık AI şirketlerinin pazar değerlemesinde de gerçek bir kırılma anı.

Riskler ve dikkat edilmesi gerekenler

GLM-5.2’nin tüm avantajlarına rağmen bazı pratik kaygılar var:

1. Z.ai hosted API kullanımı. Eğer ağırlıkları self-host etmek yerine Z.ai API üzerinden çağırırsanız, sorgularınız Çin sunucularında işlenir. Hassas veri (PII, ticari sırlar, müşteri bilgisi) için bu compliance riski. AB GDPR ve diğer veri lokalizasyonu kuralları açısından dikkatli olmak gerekiyor.

2. Self-host pratik mi? Bireysel geliştiriciler için değil. 744B model çalıştırmak ciddi altyapı gerektiriyor. Küçük takımlar için cloud GPU + tenant’ı kendi VPC’sinde tutmak (SiliconFlow, Together, Fireworks) makul seçim.

3. Long-tail Türkçe. Z.ai GLM-5.2’yi ağırlıklı olarak Çince + İngilizce üzerinde eğitti. Türkçe karmaşık akıl yürütme ve agentic kodlama görevlerinde belirgin bir kayıp olabilir — pratik test gerekli.

4. Lisans güvencesi. MIT lisans bugün net — ama Çinli açık ağırlık modellerinin gelecekteki güncellemelerinde regülasyon ortamı değişebilir. ABD veya AB yaptırımı kapsamına girmesi durumunda kullanıcı tarafında ne olur, henüz bilinmiyor.

Türk geliştiriciler için ne anlama geliyor?

Türkiye GLM-5.2 için ideal kullanıcı segmentlerinden biri:

Self-host edemeyen küçük takımlar: OpenRouter üzerinden ücretsiz veya çok ucuz erişim mevcut.
Claude Code alternatifi arayanlar: 1M context, agentic coding skoru ve sıfır lisans engeli ile Claude Code workflows’u doğrudan değiştirebilir. https://api.z.ai/api/anthropic Anthropic-compatible endpoint ile Claude Code yapılandırması bir parametre değiştirmekle yapılabilir.
OpenCode, Cline, KiloCode kullanıcıları: Hepsi GLM-5.2 desteği zaten kurulmuş.
Self-hosting düşünen kurumsal müşteriler: 8x H200 veya 4x B200 cluster, devasa şirketlere makul yatırım. Ama bunun karşılığında compliance, sınırsız token ve sıfır API maliyeti.

Anthropic Fable 5’in non-US restriksiyonunun Türk geliştiricileri doğrudan etkilediğini hatırlatmakta fayda var: teknik olarak Türkiye’deki bir geliştirici Fable 5’e direkt erişemeyecek (Anthropic’in karar kararlarına göre). GLM-5.2 bu boşluğu doldurabilir.

Kapalı kaynak vs açık kaynak: kırılma anı mı?

2024 ortalarında açık ağırlık modeller GPT-4 seviyesinin gerisindeydi. 2025 sonu – 2026 başında Qwen3, DeepSeek-V3, Kimi K2, MiniMax M2 gibi modellerle aralık kapanmaya başladı. 2026 ortasında GLM-5.2, kod yazma ve agentic görevlerde proprietary devleri (Claude Fable 5, GPT-5.5) doğrudan yarış kuvveti haline geldi.

Anthropic’in Fable 5’i export control kapsamına alması, kapalı kaynak modellerin politik düzenlemeye tabi olabileceğini somut olarak gösterdi. Bu, geliştirici tercihinde “kontrol kimde” sorusunu öne çıkardı. Kendi sunucunuzda çalışan, MIT lisanslı 744B model — politik karar değişimlerinden bağımsız.

Önümüzdeki aylarda göreceğimiz şey: kurumsal AI ekiplerinin model stratejisinde “çift kaynak” (dual sourcing) yaklaşımının norm haline gelmesi. Proprietary kapsamlı performans için Fable 5 / Opus / GPT-5.5; bağımsızlık ve maliyet için GLM-5.2, DeepSeek-V4-Pro veya Qwen3.6.

Sonuç

GLM-5.2’nin tek başına bir model olarak teknik özellikleri etkileyici: 744B/A40B MoE mimarisi, IndexShare optimizasyonu, 1M context, MIT lisans, kodlama ve web tasarımda dünya liderliği. Ama bu modelin yarattığı asıl etki, lansman zamanlamasının jeopolitik mesajında.

13 Haziran 2026, “açık ağırlık vs kapalı kaynak” tartışmasında bir tarihsel kırılma noktası olarak hatırlanacak. ABD’nin frontier modellerini export control kapsamına alması, Çin’in karşılığında en güçlü modelini lisanssız serbest bırakması — bu sembolizm önümüzdeki yılların AI politik manzarasını şekillendirecek.

Modeli denemek için: Hugging Face’te zai-org/GLM-5.2 (BF16) ve zai-org/GLM-5.2-FP8 (quantize edilmiş). OpenRouter üzerinden API çağrısı yapmak en hızlı yol. Self-host için Z.ai’ın GitHub deposunda örnek vLLM konfigürasyonları paylaşıldı.

Bu hafta açık ağırlık ekosisteminde olmak iyi bir hafta.