Cohere'den North Mini Code 1.0: 'Açık Ağırlık Araştırma Sürümü' Pazarlamasının Anatomisi — Qwen3.6 Neden Karşılaştırmada Yok?

Kanada merkezli LLM şirketi Cohere, 9 Haziran 2026’da geliştiriciler için özelleşmiş ilk modelini açık ağırlık olarak yayınladı: North Mini Code 1.0. 30 milyar parametreli, 3 milyar aktif parametreli MoE mimarisi, Apache 2.0 lisansı (Cohere Acceptable Use Policy ile birlikte), 256K context. Ama bu lansmanın daha ilginç tarafı, modelin kendisi değil — nasıl pazarlandığı.

Tek cümleyle özet: aynı boyut sınıfında Qwen3.6 ile yarışmak yerine, Cohere bilinçli olarak Qwen3.6’yı kıyaslamasından çıkarmış. Bu yazıda lansmanın benchmark’larını ayrıştıracak, modelin gerçek konumlandırmasını ve bu lansmanın açık ağırlık LLM dünyasının nereye gittiğine dair ne anlattığını inceleyeceğiz.

Önce teknik özellikler

North Mini Code’un teknik profili:

Toplam parametre: 30B.
Aktif parametre (her token): 3B (128 expert’ten 8’i aktif).
Mimari: Decoder-only Transformer, sparse MoE. Sliding-window attention (RoPE’li) + global attention (NoPE) 3:1 oranında interleaved.
Context: 256K token; 64K max output.
Lisans: Apache 2.0 + Cohere Acceptable Use Policy. Ticari kullanım için Cohere Sales ile iletişime geçilmesi öneriliyor.
Post-training: İki aşamalı SFT + agentic RLVR.
Tool calling: Native destek, interleaved thinking ile.

Yani teknik açıdan modern bir açık ağırlık agentic coding modeli — Qwen3.6, Mellum2, ve Nex-N2’nin Pro/mini varyantlarıyla aynı tasarım felsefesinde.

Cohere’in karşılaştırma seçimi

Lansman blog yazısında dikkat çeken cümle şu:

“Artificial Analysis’ Coding Index’te North Mini Code 33.4 alıyor, Qwen3.5 (35B-A3B), Gemma 4 (26B-A4B), Devstral Small 2 (24B Dense) ve hatta Nemotron 3 Super (120B-A12B), Mistral Small 4 (119B-A6B), Devstral 2 (123B) gibi çok daha büyük modelleri geride bırakıyor.”

Liste dikkatli okunduğunda eksik bir model var: Qwen3.6-35B-A3B. Cohere modelle aynı boyut sınıfında, aynı 3B aktif parametre tasarımına sahip Qwen3.6’yı karşılaştırma listesine almamış.

Sebep: gerçek rakamlar.

North Mini Code AAII Coding Index: 33.4
Qwen3.6-35B-A3B AAII Coding Index: 35.2

Qwen3.6 yaklaşık 1.8 puan önde. Bu küçük bir fark gibi görünür ama headline metriği belirleyen rakam burada.

Daha ilginci: Cohere’in blog yazısındaki referans listesi 17. madde doğrudan Qwen3.6 blog yazısına link veriyor — Gemma 4’ün skorları oradan alınmış. Yani Cohere ekibi Qwen3.6’dan haberdar, ama Gemma 4 skorlarını oradan çekerken Qwen3.6’nın kendi skorunu görmezden geliyor.

Cohere’in gerçek hikayesi

Cohere, North Mini Code’u “open weights research release” (açık ağırlıklı araştırma sürümü) olarak adlandırıyor. Bu ifade, modelin asıl amacının bir ürün olmadığını, akademik/araştırma katkısı olduğunu ima eder.

Şirketin gerçek iş modeli kapalı kaynak Cohere Command serisi modeli ve API satışı. Bu açıdan North Mini Code lansmanı, açık ağırlık ekosisteminde “biz de buradayız, teknik kapasitemiz var, ekosistemi ezmeden vitrin gösteriyoruz” mesajı.

Yazıda öne çıkan teknik yenilikler de bu yorumu destekliyor:

Asynchronous RL framework: vLLM sidecar ile sürekli rollout, K=4 step’te policy export, CISPO objective ile token-level loss aggregation.
Multi-environment training: Tek bir online RL run’ı içinde hem terminal hem SWE görevleri.
Cross-harness generalization: SFT mix’inin sadece %6’sı benchmark harness’ı (%50 değil), kalan kısım farklı harness’lar.
Veri sızıntısı önlemi: SWE-Bench ve SWE-Bench-Pro repository kaynaklarına karşı eğitim ortamlarını deduplicate etmişler.

Bunlar gerçek mühendislik katkıları. Araştırmacılar için North Mini Code kullanmak için değil, incelemek için değerli — methodology paper’ı niteliğinde bir release.

Peki kim kullanır?

Düz performans için Qwen3.6 daha güçlü ve aynı lisansta. Saf agentic coding senaryosunda bile Nex-N2-Pro (397B/A17B, OpenRouter’da bedava) çok daha üst seviye sonuçlar veriyor. Bu durumda North Mini Code’a yönlenmek için makul senaryolar:

1. Cohere ekosistemine zaten bağlı şirketler. Cohere API müşterileri için entegrasyon avantajı sağlar — aynı pipeline’da Command serisi + North Mini Code beraber kullanılabilir.

2. OpenCode kullanan geliştiriciler. Cohere bu agent harness’ına açıkça yatırım yaptı, model özellikle bu setup için optimize. Cross-harness training sayesinde benchmark-spesifik overfit yok.

3. Kendi agent framework’ünü geliştirenler. SWE-Agent, mini-SWE-agent, OpenCode, Terminus 2 gibi farklı harness’larda eğitildiği için, hiç görmediği yeni bir harness’a transfer daha iyi olabilir. Qwen3.6 benchmark’larda biraz önde ama specific harness’lara overfit etmiş olabilir.

4. Lisans çeşitliliği isteyen takımlar. Tüm AI ekosistemini Alibaba (Qwen), Çinli şirketler (StepFun, DeepSeek, GLM, Kimi), ya da büyük US oyuncularına (OpenAI, Anthropic, Google) bağlamak istemeyen takımlar için, Kanadalı Cohere’in modeli ekosistem çeşitliliği sağlıyor.

5. Multi-agent setup’ında ikinci görüş. Heterojen modeller agent ensemble’larında değer sağlar. Bir görevde Qwen3.6 ve North Mini Code’u farklı agent rollerinde kullanmak, tek bir model ailesine bağımlılığı kırar.

6. Cohere Acceptable Use Policy’sine uyabilen senaryolar. Apache 2.0’ın saf permissive yapısının üzerine Cohere kendi AUP’sını ekledi. Sales ile iletişime geçilmesi öneriliyor — bu, modeli “tam free” yapmıyor. Saf Apache 2.0 isteyenler Qwen3.6’ya gider.

Açık ağırlık ekosistemi için ne anlatıyor?

Cohere’in pozisyonu birkaç önemli trend’i yansıtıyor:

1. Vitrin lansmanları yaygınlaşıyor. Bir şirket asıl ürünü kapalı kaynak satarken, “buradayız ve kapasitemiz var” mesajı için open weights research release yapıyor. Mistral’in Devstral’ı, Cohere’in North Mini Code’u, hatta Microsoft’un Phi serisi benzer örnekler.

2. Karşılaştırma seçimi bir pazarlama taktiği. Cohere bilinçli olarak Qwen3.6’yı listeden çıkardı. Bu standart bir taktik — Türkçe deyim ile “kazanılabilecek kıyaslamalar seçilir”. Geliştiriciler her lansmanda bu seçim filtresinin farkında olmalı.

3. Aynı boyut sınıfında rekabet sıkışıyor. 30B/3B-aktif MoE sınıfında artık Qwen3.6, Mellum2-12B, Gemma 4 26B-A4B, Granite 4.0-H-Tiny, North Mini Code — en az 5 farklı oyuncu var. Her biri belirli bir niş için optimize. Geliştirici seçimi artık “benchmark lideri” değil, “use case’ime en uygun” sorusuna kaymalı.

4. Cross-harness training önemli bir trend. Cohere’in vurgusu doğru: gerçek dünyada modeli farklı agent framework’lerinde kullanıyoruz. Tek bir benchmark harness’ına overfit etmek deployment’ta zarar veriyor. Diğer şirketler de benzer yöne gitmeli.

5. Veri sızıntısı önlemi şeffaflığı. SWE-Bench ve SWE-Bench-Pro’ya karşı deduplicate etme açıkça vurgulanması, ekosistemde “rakipler benchmark’larda contaminate ediyor olabilir” ima eden bir mesaj. Cohere bu konuda dürüst — muhtemelen rakiplerinden bazıları bu özeni göstermiyor.

Sonuç: kullanmaz, ama inceler

North Mini Code 1.0, “hangisi en iyi 30B sınıfı agentic coding modeli” sorusunun cevabı değil. Bugün için bu sorunun cevabı muhtemelen Qwen3.6-35B-A3B. Daha üst sınıfa çıkarsanız Nex-N2-Pro (397B/A17B Apache 2.0) hem ücretsiz hem çok daha güçlü.

Ama North Mini Code şu sorunun iyi cevabı: “Modern agentic coding modeli nasıl eğitilir, hangi mimarisi seçimleri yapılır, RL pipeline’ı nasıl kurulur?” Cohere’in blog yazısı asenkronlu RL, CISPO objective, windowed FIFO, cross-harness data mixing gibi teknik detayları açıkça paylaşıyor. Bu bilgi, model fine-tune eden veya kendi modelini eğiten araştırmacılar için kayda değer.

Şirketlerin lansman benchmark’larını yorumlarken kim hangi modellerle karşılaştırıyor, kim hangileri görmezden geliyor — bunu gözlemlemek bizim için önemli bir alışkanlık. Cohere’in Qwen3.6’yı listeden çıkarması açık bir örnek. Bir sonraki Mistral, IBM, Meta veya Stability lansmanında benzer filtreyi aramanın değeri var.

Model Hugging Face’te CohereLabs/North-Mini-Code-1.0 (BF16) ve FP8 quantize versiyonlarıyla mevcut. OpenCode ile birlikte denemek isteyenler için Cohere’in resmi entegrasyon dokümanı paylaşılmış.