Bilgi Tabanı Bölümleri ▾

Araçlar

Teknoloji

Kimi K2.6: Gonka ağının ikinci modeli

Uzun bir süre Gonka ağı tek bir modelle çalıştı — Alibaba Cloud'dan Qwen3-235B. Mayıs 2026'da bu durum değişti: DevShards mekanizması aracılığıyla birden fazla model desteği başlatıldı ve ilk olarak Çinli Moonshot AI şirketinden Kimi K2.6 geldi. Bu modelin ne olduğunu, Qwen3-235B'den farklarını, Gonka'nın çoklu model yeteneğini teknik olarak nasıl uyguladığını ve yeni modeli API Ağ Geçidimiz aracılığıyla nasıl deneneceğini inceleyelim.

Moonshot AI'dan Kimi K2.6 nedir

Kimi K2.6, Pekin merkezli Moonshot AI şirketi tarafından geliştirilen Kimi serisinden büyük bir dil modelidir (LLM). Moonshot AI, Yang Zhilin liderliğindeki bir araştırmacı ekibi tarafından 2023 yılında kurulan Çin'in önde gelen yapay zeka laboratuvarlarından biridir. Şirket, Alibaba, Tencent ve diğer büyük yatırımcılardan fon aldı ve Asya'da yapay zeka gelişimine yön veren "Çinli yapay zeka kaplanları" listesine girdi.

Kimi serisi 2024'ten beri biliniyor. Erken versiyonları (K1, K1.5) hemen olağanüstü uzun bağlam penceresiyle dikkat çekti – tek bir istekte 200.000 tokene kadar, ki bu yayınlandığı dönemde halka açık modeller için bir rekordu. Uzun bağlam, bir tek istekte bütün bir kitabı, orta büyüklükte bir kod tabanını veya bir yasal belge koleksiyonunu analiz etme pratik imkanı anlamına gelir. Kimi'nin piyasaya sürülmesi sırasında bu özellik güçlü bir rekabet avantajıydı.

K2 versiyonu 2025'te çıktı ve ilkesel bir mimari sıçrama getirdi – MoE (Mixture of Experts) geçişi. Aynı mimari Qwen3-235B ve DeepSeek-R1'in de temelini oluşturur – 2025-2026 yıllarının en büyük modelleri için fiili bir standart haline geldi. MoE, yüz milyarlarca parametreye "sadece" sahip olmayı sağlar, ancak her istekte yalnızca bir alt küme (genellikle %5-10) etkinleştirilir, bu da karşılaştırılabilir kalitede çıkarım hesaplama maliyetini radikal bir şekilde düşürür.

K2.6, makalenin yazıldığı an itibarıyla K2 serisinin en son yinelemesidir. Moonshot AI'dan yapılan kamuya açık açıklamalardan, bu sürümde modelin muhakeme (mantıksal akıl yürütme), kod üretimi ve yerel araç çağırma (tool calling) yeteneklerinin geliştirildiği anlaşılmaktadır. Gonka ağında model moonshotai/Kimi-K2.6 olarak tanımlanır – API isteğinin model alanına tam olarak bu adın iletilmesi gerekir.

Kimi K2.6 ve Qwen3-235B Karşılaştırması

Her iki model de en büyük Çinli yapay zeka laboratuvarlarının amiral gemisi geliştirmelerini temsil ediyor ve her ikisi de tek, OpenAI uyumlu bir arayüz olan JoinGonka Gateway aracılığıyla erişilebilir. Ancak, farklı güçlü yönleri ve farklı mirasları var, bu da aralarındaki seçimi "hangisi daha iyi" sorusundan çok "hangisi göreve uygun" sorusuna dönüştürüyor.

ÖzellikKimi K2.6Qwen3-235B-A22B
ÜreticiMoonshot AI (Pekin)Alibaba Cloud (Hangzhou)
Şirket Kuruluş Yılı20232009 (Alibaba Cloud)
MimariMoEMoE (toplam 235B, aktif 22B)
Bağlam PenceresiUzun bağlam (Kimi serisinin kartviziti)131.072 token (~100.000 kelime)
Güçlü YönüAkıl yürütme, uzun bağlam, kod üretimiEvrensel, çok dillilik (119 dil), kararlı araç çağırma
JoinGonka üzerinden fiyat1M token için $0.0011M token için $0.001
API Tanımlayıcısımoonshotai/Kimi-K2.6Qwen/Qwen3-235B-A22B-Instruct-2507-FP8
Araç çağırmaİnce ayar aşamasında (auto-choice)Yerel, kararlı (PR #767)
Gonka ağındaki durumuDevShards aracılığıyla başlatıldı (Mayıs 2026)Ağustos 2025'ten beri kararlı

Muhakeme testlerinde (MATH-500, GSM8K, AIME) Kimi K2 serisi, tarihsel olarak açık ağırlıklı modellerin üst grubunda yer alarak DeepSeek-R1 ve o1-stil modellerle rekabet etmektedir. Kod üretimi görevlerinde (HumanEval, MBPP) her iki model de benzer seviyelerde performans gösterir. Çok dillilik ve çeviri konusunda Qwen3-235B, 119 dilde eğitim alması nedeniyle avantajlıdır, Kimi ise Çince ve İngilizce için daha optimize edilmiştir.

2026'daki karşılaştırma testleri hakkında önemli bir not: En iyi modeller arasındaki fark, kamuya açık testlerde yüzde birimlerine düşmüştür ve bu fark genellikle testlerin kendi istatistiksel hata payı içindedir. Pratik çalışma için önemli olan, "MMLU'da kim %2 daha yüksek" değil, görevlerin doğasıdır: modele hangi bağlamı ilettiğiniz, mantıksal zincirlerin ne kadar karmaşık olduğu, uzun bir diyalog geçmişine ihtiyaç duyulup duyulmadığı, hangi dillerin kullanıldığıdır. Bu nedenle yukarıdaki tablo modelleri sıralamaz – her birinin hangi görev profili için optimize edildiğini hızlıca anlamaya yardımcı olur.

Pratik seçim için: Görev uzun bir bağlam (büyük belgelerin analizi, kapsamlı bir kod tabanının okunması, geçmişi koruyan uzun diyaloglar) veya karmaşık muhakeme görevleri gerektiriyorsa, Kimi K2.6 ile başlamalısınız. Evrensel görevler, çeviriler, çok dilli çalışma ve üretimde istikrarlı araç çağırma için Qwen3-235B, Gonka ağında daha uzun süre çalıştığı için daha kanıtlanmış bir seçenek gibi görünmektedir. Üretimde iyi bir strateji, kodunuzda her iki modele de sahip olmaktır: model parametresi aracılığıyla hızlı bir değişiklik, uygulama mimarisini değiştirmeden göreviniz doğrultusunda aralarında geçiş yapmanızı sağlar.

DevShards: Gonka ikinci modeli nasıl başlattı?

2026 baharına kadar tüm Gonka ağı tam olarak bir modele hizmet veriyordu – Qwen3-235B. Mimari açıdan bu mantıklı bir karardı: DiLoCo aracılığıyla dağıtılmış çıkarım, tüm ağ katılımcılarının aynı modeli video belleğinde tutmasını gerektirir, aksi takdirde herhangi bir düğümün herhangi bir isteği işleyebileceği garanti edilemez. FP8 biçimindeki tam Qwen3-235B, yaklaşık 640 GB VRAM kaplar ki bu, her MLNode için başlı başına büyük bir yükümlülüktür.

Çok modelli bir ağa geçiş için, aynı anda birden fazla modeli barındırmaya izin veren, ancak her ana bilgisayardan hepsini çalıştırmasını gerektirmeyen bir mekanizma gerekiyordu. Bu mekanizma DevShards oldu – her biri belirli bir modelde uzmanlaşmış ayrı ağ parçaları. Bir parçanın içindeki düğümler aynı model üzerinde çalışır ve ağ yönlendiricisi isteği gerekli modele sahip parçaya yönlendirir.

Fikir sıfırdan gelmedi – bahar 2026'da topluluk oylamasına sunulan Gonka İyileştirme Teklifi #800 "Çok Modelli PoC"de resmileştirildi. Teklif, ağ katılımcılarının ve doğrulayıcılarının desteğini aldı ve Nisan-Mayıs 2026'da uygulandı. Kimi K2.6, ayrı bir DevShard üzerinde başlatılan ilk model oldu – yani aslında yeni yaklaşımın bir test uygulamasıydı. Eğer deneyim başarılı olursa, üçüncü, dördüncü vb. modellerin başlatılmasının önünde hiçbir engel kalmaz – her biri kendi parçası üzerinde, kendi ana bilgisayar kümesiyle, kendi ekonomisiyle ve kendi yol haritasıyla.

Bu, kullanıcılar ve geliştiriciler için ne anlama geliyor:

  • Tek bir API – birden fazla model. JoinGonka Gateway üzerinden uç noktayı veya anahtarları değiştirmenize gerek yok: isteğin gövdesinde farklı bir model belirtmeniz yeterli. OpenAI uyumlu biçim tamamen korunur.
  • Fiyat aynı. Şu anda Kimi K2.6, ağda Qwen3-235B ile aynı orandan ücretlendiriliyor – Gateway üzerinden 1M token başına 0.001$. Gelecekte fiyatlar modellere göre farklılık gösterebilir, ancak başlangıçta tek fiyatlandırma, kullanıcı geçişini kolaylaştırmak için bilinçli bir karardır.
  • Kararlılık shard yüküne bağlıdır. Erken aşamada Kimi shard'ı, ana Qwen shard'ından daha az ana bilgisayara sahiptir, bu nedenle istek yoğunlaştığında model geçici olarak 429 too many concurrent requests döndürebilir. Bu, yeni bir model için normal bir aşamadır – ilgi arttıkça ana bilgisayarlar Kimi shard'ına bağlanacak ve limitler artacaktır.
  • Araç çağırma – ince ayar sürecinde. Bu makalenin yazıldığı an itibarıyla Gonka ağındaki Kimi K2.6'da otomatik araç seçimi (tool_choice: "auto") ile ilgili küçük sorunlar tespit edilmiştir. Gonka ekibi, davranışı OpenAI standardına uygun hale getirmek için çalışmaktadır; üretimde kritik olan araç çağırma senaryoları için şimdilik Qwen3-235B kullanılması önerilir.

Kimi K2.6'yı Gonka aracılığıyla nasıl deneyebilirsiniz

En doğrudan yol JoinGonka API Gateway üzerinden geçer. Gateway, OpenAI uyumlu bir API sağlar; bu, GPT, Claude veya Qwen ile çalışan kodun, istek gövdesindeki model alanı değerini değiştirdikten sonra Kimi ile de çalışacağı anlamına gelir.

curl ile minimum örnek:

curl https://gate.joingonka.ai/v1/chat/completions \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "moonshotai/Kimi-K2.6",
    "messages": [
      {"role": "user", "content": "MoE ve yoğun modeller arasındaki farkı açıklayın"}
    ]
  }'

Aynı istek Python ile openai kütüphanesi üzerinden:

from openai import OpenAI

client = OpenAI(
    api_key="YOUR_API_KEY",
    base_url="https://gate.joingonka.ai/v1",
)

response = client.chat.completions.create(
    model="moonshotai/Kimi-K2.6",
    messages=[{"role": "user", "content": "Merhaba, Kimi"}],
)
print(response.choices[0].message.content)

Akış (Server-Sent Events) – etkileşimli arayüzler ve yanıtın üretim sırasında gösterilmek istendiği sohbetler için:

stream = client.chat.completions.create(
    model="moonshotai/Kimi-K2.6",
    messages=[{"role": "user", "content": "MoE hakkında bir deneme yaz"}],
    stream=True,
)
for chunk in stream:
    delta = chunk.choices[0].delta.content
    if delta:
        print(delta, end="", flush=True)

Kimi K2.6'nın maliyeti, Qwen3-235B ile aynıdır: 1 milyon token başına 0.001$. Bu, GPT-5.4'ten ~2.500 kat, Claude Sonnet 4.5'ten ise ~3.000 kat daha ucuzdur. JoinGonka Gateway'e kaydolduğunuzda, ağın herhangi bir modelini test etmek için ücretsiz 10 milyon token alırsınız – bu, birkaç saatlik yoğun çalışma veya on binlerce normal istek için yeterlidir.

Geliştirme araçlarıyla uyumluluk: OpenAI API ile çalışan her şey, Gateway üzerinden Kimi ile de çalışır. Model düzeyinde yalnızca model parametresini değiştirmeniz yeterlidir:

  • Cursor: Özel Model ayarlarında moonshotai/Kimi-K2.6 değerini belirtin.
  • Claude Code: Ortam değişkeni ANTHROPIC_MODEL veya --model bayrağı.
  • OpenClaw, Cline, Continue.dev: Yapılandırmadaki CustomChatModel'in adını değiştirin.
  • LangChain, n8n: İstemcinin başlatılmasında model parametresi.
  • Open WebUI, LibreChat: Gonka'yı özel bir sağlayıcı olarak ekledikten sonra model açılır listede görünür.

Mevcut modellerin listesi, Gateway örneğinizin GET /v1/models uç noktasında her zaman günceldir – kullanıcıların tam listeyi görmesi ve modelleri kendilerinin seçebilmesi için uygulamanızın kullanıcı arayüzüne dinamik olarak çekmek kolaydır.

Yayınlandığı sırada /try sayfasındaki demo sohbeti yalnızca Qwen3-235B ile çalışmaktadır – widget'taki çok modelli seçici yol haritasındadır. Kimi'yi hemen denemek için Gateway API'yi kullanın: ücretsiz 10M token, birkaç saatlik deneme için yeterli olacaktır. Yanıt 429 too many concurrent requests ise – bu, Gonka ağının erken büyüme aşamalarındaki yeni bir model için normal bir durumdur. İsteği birkaç saniye sonra tekrarlayın veya daha düşük bir yük penceresini bekleyin.

Gonka ağı için sırada ne var: Kimi için DevShards'ın başarısı, diğer modellere kapı aralamaktadır. Topluluk tartışmalarında DeepSeek-V3/R1, Llama 4 ve koda özel modeller yer almaktadır. Her yeni model, yeni bir shard, yeni ana bilgisayarlar, kullanıcılar için yeni fırsatlar ve GPU sağlayıcıları için yeni bir gelir kaynağı demektir. Çok modelli mimari stratejik olarak da önemlidir: tek bir modele bağlı bir ağ, temelden kırılgandır (yeni bir sürümün çıkışı – bir geçiş krizi), oysa aynı anda birden fazla modeli barındırabilen bir ağ, yumuşak ve sürekli olarak gelişir.

Kimi K2.6, uzun bağlamı ve güçlü akıl yürütme yetenekleri olan bir Moonshot AI MoE modelidir. Mayıs 2026'da Qwen3-235B'den sonra Gonka ağının ikinci modeli oldu ve DevShards mekanizması (model başına ayrı bir shard) aracılığıyla başlatıldı. JoinGonka Gateway üzerinden OpenAI uyumlu API aracılığıyla 1M token başına 0.001 $ karşılığında erişilebilir – Qwen ile aynı fiyata. API'deki model tanımlayıcı: moonshotai/Kimi-K2.6. Erken aşamada istek yoğunluğunda geçici 429 hataları oluşabilir; araç çağırma ince ayar aşamasındadır.

Daha fazla bilgi edinmek ister misiniz?

Diğer bölümleri keşfedin veya şimdi GNK kazanmaya başlayın.

Gateway aracılığıyla Kimi K2.6'yı deneyin →