Holo3: Sadece 3B Aktif Parametreyle Dev Modelleri Geride Bırakan Fransız Yapay Zeka Modeli

Fransız yapay zeka şirketi H Company, bilgisayar kullanımı ve tarayıcı navigasyonu alanında çığır açan yeni modeli Holo3-35B-A3B‘yi duyurdu. Qwen 3.5 35B-A3B üzerine inşa edilen bu açık kaynaklı model, boyutunun çok üzerinde bir performans sergileyerek sektörün en büyük modellerini bile geride bırakıyor.

3 Milyar Aktif Parametreyle Devlere Meydan Okuyor

Holo3-35B-A3B, Sparse Mixture-of-Experts (MoE) mimarisini kullanıyor. Toplam 35 milyar parametreye sahip olmasına rağmen, çıkarım (inference) sırasında yalnızca 3 milyar parametre aktif oluyor. Bu da modelin çok düşük hesaplama maliyetiyle çalışabileceği anlamına geliyor. Buna rağmen elde ettiği sonuçlar, yüzlerce milyar parametrelik modellerle boy ölçüşecek düzeyde.

Benchmark Sonuçları Göz Kamaştırıyor

Holo3 ailesinin benchmark sonuçları, özellikle bilgisayar kullanımı (computer use) ve kurumsal görevlerde dikkat çekici bir tablo ortaya koyuyor:

Bilgisayar Kullanımı (Computer Use)

Benchmark Holo3 122B-A10B Holo3 35B-A3B Qwen3.5 397B-A17B Claude Sonnet 4.6
OSWorld-Verified %78,9 %77,8 %62,1 %72,5
WebArena %64,9 %64,8 %62,1 %65,6

OSWorld-Verified testinde Holo3 35B-A3B, yalnızca 3B aktif parametreyle %77,8 skora ulaşarak Claude Sonnet 4.6’nın %72,5’ini ve Qwen 3.5 397B’nin %62,1’ini geride bırakıyor. Aktif parametre sayısı bakımından rakiplerinin onlarca katı daha küçük olan bir modelin bu skoru yakalaması gerçekten etkileyici.

Kurumsal Görevler (H Corporate)

Kategori Holo3 122B-A10B Holo3 35B-A3B Qwen3.5 397B-A17B Claude Sonnet 4.6
E-Ticaret %94,8 %94,1 %92,2 %61,1
İş Yazılımları %85,2 %86,3 %82,4 %66,4
İşbirliği (Collaboration) %72,3 %76,0 %66,3 %52,8
Çoklu Uygulama (Multi-Apps) %59,5 %50,0 %61,9 %69,0

Kurumsal görevlerde Holo3 serisi adeta rakipsiz. E-ticaret senaryolarında %94’ün üzerinde başarı oranına ulaşırken, iş yazılımları ve işbirliği kategorilerinde 35B-A3B versiyonu büyük kardeşi 122B modelini bile geçmeyi başarıyor.

UI Grounding

Benchmark Holo3 122B-A10B Holo3 35B-A3B Qwen3.5 397B-A17B
ScreenSpot-Pro %72,2 %67,6 %69,3
OSWorld-G %79,4 %77,3 %78,4

Neden Önemli?

Holo3-35B-A3B’nin önemi birkaç noktada özetlenebilir:

Verimlilik: Sadece 3B aktif parametreyle çalışması, modelin çok daha düşük donanım gereksinimleriyle ve çok daha hızlı bir şekilde çıkarım yapabilmesini sağlıyor. Bu, yapay zeka ajanlarının yaygınlaşması için kritik bir faktör.

Açık kaynak: Apache 2.0 lisansıyla yayınlanan model, ticari kullanım dahil her türlü amaçla serbestçe kullanılabilir. Model ağırlıkları Hugging Face üzerinden indirilebilir durumda.

Gerçek dünya performansı: Benchmark sonuçları laboratuvar ortamında değil; web navigasyonu, masaüstü uygulamaları ve kurumsal iş akışları gibi gerçek dünya senaryolarında elde edilmiş. Bu da modelin pratik kullanılabilirliğini doğruluyor.

Teknik Detaylar

Model, Qwen/Qwen3.5-35B-A3B üzerine özel eğitimle ince ayar (fine-tuning) yapılarak geliştirilmiş. Eğitim sürecinde açık kaynak veri setleri, büyük ölçekli sentetik trajektoriler ve insan tarafından etiketlenmiş yüksek kaliteli örnekler kullanılmış. Modelin güçlü yanları arasında görsel arayüz yorumlama, karmaşık içerik üzerinde akıl yürütme ve hassas eylem yürütme yer alıyor.

H Company, daha önce web navigasyonunda dünya standartlarını belirleyen Holo2 modeliyle tanınıyordu. Holo3 ailesi, bu temelin üzerine bilgisayar kullanımı ve masaüstü ajanları alanında da liderliği hedefliyor.

Kaynak: Hugging Face – Holo3-35B-A3B | H Company Blog

Comments

Bir yanıt yazın

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir