Bilgi Tabanı Bölümleri ▾

Araçlar

Teknoloji

Qwen3-235B: Gonka'nın çıkardığı model

Gonka ağı sadece GPU kiralamaz, aynı zamanda çıkarım için yapay zeka modellerine hizmet eder. Uzun süre boyunca tek model, Alibaba Cloud tarafından geliştirilen Qwen3-235B-A22B-Instruct idi ve Mayıs 2026'da Moonshot AI'dan Kimi K2.6 da eklendi. Bu modelin ne olduğunu, Gonka'nın neden onu seçtiğini ve API Ağ Geçidimiz aracılığıyla nasıl deneyebileceğinizi inceleyelim.

Qwen3-235B nedir

Qwen3-235B-A22B-Instruct-2507-FP8, Alibaba Cloud'daki Qwen ekibi tarafından geliştirilen Qwen3 ailesinin büyük bir dil modelidir (LLM). Tam adı şöyle açıklanır: Qwen3 — serinin üçüncü nesli, 235B — toplam 235 milyar parametre, A22B — her istekte 22 milyar aktif parametre, Instruct — talimatları takip etmek üzere eğitilmiş sürüm, 2507 — Temmuz 2025 sürümü, FP8 — bellek optimizasyonu için 8 bit nicemleme.

Temel mimari özellik – MoE (Mixture of Experts). Her token'ın tüm parametrelerden geçtiği “yoğun” modellerin (GPT-5.5, Claude Sonnet 4.6) aksine, MoE modeli her istek için yalnızca bir dizi “uzmanı” – sinir ağının özel bloklarını – etkinleştirir. Qwen3-235B durumunda, 235 milyar parametreden her token için yalnızca 22 milyar etkinleştirilir – %10'dan az. Bu, 22B'lik bir modelin hesaplama maliyetleriyle 200B+ parametreli modellere eşit kalite sağlar.

Pratikte bu, modelin hızından beklenenden daha akıllı olduğu anlamına gelir. Benzer kalitedeki yoğun modellerden önemli ölçüde daha hızlı istekleri işlerken, çıkarım için çok daha az VRAM gerektirir. MoE'nin 2025-2026 yıllarının en büyük modelleri için baskın mimari haline gelmesinin nedeni budur.

Qwen3-235B'nin bağlam penceresi 131.072 token'dır (yaklaşık 100.000 kelime) – bu, tek bir istekte bütün kitapları, kod tabanlarını veya uzun hukuki belgeleri analiz etmek için yeterlidir. Model, Rusça, İngilizce, Çince, Arapça, Hintçe ve onlarca diğerleri dahil 119 dili destekler – bu da onu piyasadaki en çok dilli modellerden biri yapar.

Özellikler ve Benchmarklar

Qwen3-235B, en büyük kapalı ve açık modellerle rekabet eder. İşte temel özelliklerin karşılaştırması:

ModelParametrelerBağlamMoEAçık KaynakFiyat (1M token için)
Qwen3-235B (JoinGonka aracılığıyla)235B (22B aktif)131KEvetEvet (Apache 2.0)$0.001
GPT-5.5 (OpenAI)~1.8T (tahmini)128KEvet (varsayımsal)Hayır$5.00
Claude Sonnet 4.6 (Anthropic)Açıklanmadı200KHayır (varsayımsal)Hayır$3.00
Llama 4 Maverick (Meta)400B (17B aktif)1MEvetEvet (Llama Lisansı)$0.20+ (barındırma)
DeepSeek-R1 (DeepSeek)671B (37B aktif)128KEvetEvet (MIT)$0.55

Qwen3-235B, çoğu benchmark'ta GPT-5.5 ve Claude Sonnet 4.6 ile karşılaştırılabilir bir kalite seviyesi sergilerken, JoinGonka Gateway aracılığıyla maliyeti GPT-5.5'ten 5.000 kat daha düşüktür. Bu iki faktör sayesinde mümkündür: MoE mimarisi hesaplama maliyetlerini düşürür ve merkeziyetsiz Gonka ağı, veri merkezlerinin kar marjını ortadan kaldırır.

MMLU-Pro, HumanEval, MATH-500 ve GSM8K benchmark'larında model, matematiksel akıl yürütme (reasoning) görevlerinde yalnızca DeepSeek-R1'e rakip olan en iyi üç açık kaynak modelden biridir. Kod üretimi, çeviri ve talimat takip görevlerinde Qwen3-235B, Llama 4 Maverick'i sürekli olarak geride bırakır ve Claude Sonnet 4.6 ile karşılaştırılabilir.

Gonka Qwen3-235B'yi nasıl kullanıyor?

Qwen3-235B modeli, Gonka ağı içinde dağıtılmış olarak çalışır — inference için uyarlanmış DiLoCo protokolü aracılığıyla. FP8 formatında tam model yaklaşık 640 GB video belleği (VRAM) gerektirir, bu da tek bir GPU'ya sığdırılamaz — hatta H100 80GB veya H200 141GB bile yeterli değildir. Bu nedenle model, katmanlar halinde (tensor parallelism + pipeline parallelism) birden fazla ML düğümü arasında bölünmüştür.

Pratikte Qwen3-235B, her biri en az 40 GB VRAM'e sahip 8-16 GPU düğümlü bir kümede çalışır. Aktarım Aracıları isteği doğru kümeye yönlendirir, her düğümdeki vLLM modelin kendi parçasını işler, sonuçlar birleştirilir ve kullanıcıya döndürülür. Tüm süreç yüzlerce milisaniye sürer — kullanıcı, isteğinin dünyanın farklı yerlerindeki bir düzine GPU tarafından işlendiğini fark etmez.

Önemli bir teknik detay: Gonka, hizmet vermek için vLLM'yi motor olarak kullanır. vLLM, PagedAttention aracılığıyla yüksek performanslı metin üretimi sağlayan açık kaynaklı bir projedir — bu algoritma, birden fazla isteğin paralel olarak işlenmesi sırasında video belleği kullanımını optimize eder. Bu, ağın binlerce eşzamanlı kullanıcıya kaliteden ödün vermeden hizmet vermesini sağlar.

Model, yerel araç çağrısını destekler — doğrudan model yanıtından fonksiyonların ve araçların çağrılması. Bu özellik, araç çağrılarını belirlemek için 0.958 eşikle PR #767 aracılığıyla Gonka'ya eklendi. Bu, geliştiricilerin harici API'ler, veritabanları ve araçlarla etkileşim kuran AI aracıları oluşturabileceği anlamına gelir — hepsi Qwen3-235B'ye tek bir istek aracılığıyla.

Mevcut Gonka ağı, 120'den fazla ML düğümünde birleştirilmiş 4.000'den fazla GPU'ya (H100, H200, A100, RTX 4090 ve diğerleri) sahiptir. Bu, dünyadaki AI inference için en büyük dağıtılmış GPU ağlarından biridir — ve tüm bu güç Qwen3-235B'ye hizmet etmeye yöneliktir.

Qwen3-235B nasıl denenir?

Qwen3-235B'yi denemenin en kolay yolu JoinGonka API Ağ Geçidi'dir. Ağ Geçidi, OpenAI uyumlu bir API sağlar, bu da şu anlama gelir: OpenAI için yazılmış herhangi bir kod, URL'yi ve API anahtarını değiştirerek Qwen3-235B ile değişiklik yapmadan çalışır.

Örnek istek:

curl https://gate.joingonka.ai/api/v1/chat/completions \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "qwen3-235b-a22b",
    "messages": [{"role": "user", "content": "Explain MoE architecture"}]
  }'

Maliyet: 1 milyon jeton için 0.001 $ — bu, GPT-5.5'ten (5.00 $/1M) 5.000 kat ve Claude Sonnet 4.6'dan (3.00 $/1M) 3.000 kat daha ucuzdur. Kaydolduğunuzda test etmek için 10 milyon ücretsiz jeton alırsınız.

Ağ Geçidi, popüler geliştirme araçlarıyla uyumludur: Hızlı Başlangıç, Python, Node.js ve curl aracılığıyla bağlantı kurmayı açıklar. Ayrıca IDE entegrasyonları (Cursor, Continue, Cline, Aider ve Claude Code) ve yapay zeka aracı çerçeveleri (LangChain, n8n, LibreChat, Open WebUI) desteklenmektedir.

Hızlı başlangıç için:

  1. gate.joingonka.ai adresinden kaydolun (bir cüzdan bağlayın veya yeni bir tane oluşturun)
  2. Kontrol Panelinden bir API anahtarı alın
  3. Kodunuzda api.openai.com yerine gate.joingonka.ai/api kullanın
  4. qwen3-235b-a22b modelini kullanın

JoinGonka aracılığıyla Qwen3-235B, hobi projesi fiyatına kurumsal düzeyde yapay zeka demektir.

Karşılaştırma için: Aynı Qwen3-235B modeli OpenRouter üzerinden 1M için 0.071 $/0.100 $ maliyetindedir; JoinGonka'da 0.001 $'dır (70-100 kat daha pahalı).

Qwen3-235B-A22B, Alibaba Cloud'dan 235 milyar parametreye sahip bir MoE modelidir ve Gonka ağı tarafından merkeziyetsiz yapay zeka çıkarımı için kullanılır. MoE mimarisi sayesinde, GPT-5.5 düzeyinde kaliteyi 5.000 kat daha düşük bir maliyetle sunar. JoinGonka Gateway üzerinden model, OpenAI uyumlu bir API aracılığıyla 1M token başına 0,001$ fiyatla erişilebilir.

Daha fazla bilgi edinmek ister misiniz?

Diğer bölümleri keşfedin veya şimdi GNK kazanmaya başlayın.

Qwen3-235B'yi Deneyin →