Qwen 3.6 35B A3B: Açık Kaynak Verimliliğinde Yeni Standart

Özet

Alibaba’nın Qwen ekibi, kendi sıkletinin çok üzerinde performans sergileyen seyrek bir Uzmanlar Karışımı (MoE) modeli olan Qwen 3.6 35B A3B’yi yayınladı. Toplam 35 milyar parametreye sahip olmasına rağmen token başına sadece 3 milyar aktif parametre kullanan model, Claude Opus 4.7 gibi yerleşik kapalı kaynaklı öncü modellerle yarışan bir akıl yürütme ve kodlama performansı sunuyor. Bu sürüm, “Açık Öncü” (Open Frontier) hareketinde önemli bir dönüm noktasını temsil ediyor ve en ileri düzey yapay zekayı yerel donanım kullanan geliştiriciler için erişilebilir kılıyor.

Ne oldu?

2 Nisan 2026’da Alibaba, Qwen 3.6 neslinin ilk açık kaynaklı varyantı olan 35B-A3B modelini kullanıma sundu. Gelişmiş bir MoE mimarisi üzerine inşa edilen bu model, “3B aktif” konfigürasyonunu kullanıyor; yani herhangi bir token için sadece 3 milyar parametre devreye giriyor. Bu aşırı seyreklik durumuna rağmen model, özellikle otonom kodlama ve karmaşık mantıksal akıl yürütme görevlerinde açık kaynaklı liderlik tablolarının zirvesine yerleşti.

Neden önemli?

Qwen 3.6 35B A3B’nin yayınlanması, “kaba kuvvet” ölçeklendirmeden mimari verimliliğe geçişin sinyalini veriyor. Daha önce Claude Opus veya GPT-4 ile kıyaslanabilir bir performans elde etmek, kurumsal düzeyde kümeler olmadan çalıştırılması imkansız olan devasa parametre sayıları gerektiriyordu. Alibaba, sadece 3 milyar aktif parametre ile benzer sonuçlar sunarak, en üst düzey yapay zekayı etkili bir şekilde demokratikleştirdi ve geliştiricilerin standart bir üst düzey dizüstü bilgisayarda “Claude sınıfı” bir model çalıştırmasına olanak tanıdı.

Kanıtlar

Kodlama Karşılaştırmaları: HumanEval ve MBPP+ testlerinde Qwen 3.6 35B A3B, Claude Opus 4.7’nin sürekli olarak 2-3 puan gerisinde kalarak çok yakın sonuçlar elde ediyor.
Yaratıcı Yetenekler: İlk topluluk testleri, modelin metin istemlerinden karmaşık SVG illüstrasyonları oluşturma gibi hassas görevlerde Opus’tan daha iyi performans gösterdiğini ortaya koyuyor.
Yerel Kurulum: r/LocalLLaMA üzerindeki kullanıcılar, BF16 versiyonunu tüketici sınıfı NVIDIA GPU’larda (örneğin RTX 4090 ve hatta kuantizasyon ile 3090) başarıyla çalıştırarak kullanılabilir hızlara ulaştılar.

Analiz

Model adındaki “A3B” (3B Aktif) kısmı en önemli özelliği. Bu, modern büyük dil modellerindeki (LLM) bilgi yoğunluğunun, çıkarım (inference) sırasındaki hesaplama maliyetinden ayrılabileceğini kanıtlıyor. Bu yaklaşım, daha fazla veri ve kalıp depolayabilen “daha geniş” bir modelin (35B toplam parametre), gerçek düşünme süreci sırasında “dar” (3B aktif) kalarak verimli çalışmasını sağlıyor. Bu yöntemin, yeni nesil cihaz içi yapay zeka için standart haline gelmesi muhtemel.

Pratik çıkarım

Yerel kodlama asistanları veya otonom iş akışları oluşturuyorsanız, Qwen 3.6 35B A3B şu anda temel modeliniz için en güçlü adaydır. Açık kaynak dünyasında şu anda mevcut olan en iyi performans-hesaplama oranını sunuyor. Birçok görev için, kalite kaybı yaşamadan kapalı kaynaklı öncü modellere yapılan pahalı API çağrılarının yerini alabilir.

Açık sorular

Qwen 3.6’nın daha büyük varyantları (örneğin olası bir 110B veya 400B modeli), söylentisi dolaşan GPT-5 veya yeni nesil Gemini modelleriyle nasıl kıyaslanacak?
MoE modellerinin aşırı seyrekliği, uzun vadede yoğun (dense) modellere kıyasla genel bilgide bir “doygunluk noktasına” yol açacak mı?

Qwen 3.6 35B A3B: Açık Kaynak Verimliliğinde Yeni Standart

Qwen 3.6 35B A3B: Açık Kaynak Verimliliğinde Yeni Standart

Özet

Ne oldu?

Neden önemli?

Kanıtlar

Analiz

Pratik çıkarım

Açık sorular

Kaynaklar