Sections de la base de connaissances ▾
Pour les débutants
Pour les investisseurs
- D'où vient la valeur du jeton GNK
- Gonka vs concurrents : Render, Akash, io.net
- Les Liberman : de la biophysique à l'IA décentralisée
- Tokenomics GNK
- Risques et perspectives de Gonka : analyse objective
- Gonka vs Render Network : comparaison détaillée
- Gonka vs Akash : inférence d'IA vs conteneurs
- Gonka vs io.net : inférence vs marketplace GPU
- Gonka vs Bittensor : une comparaison détaillée des deux approches de l'IA
- Gonka vs Flux : deux approches du minage utile
- Gouvernance chez Gonka : comment le réseau décentralisé est géré
Technique
Analyse
- Gonka — Linux pour l'ère de l'IA
- Kill Switch : pourquoi la décentralisation de l'IA est nécessaire
- Carburant, pas or – de l'or numérique au carburant d'IA
- Preuve de travail utile : guide complet sur le minage utile
- 112 milliards de dollars de trou – la faillite cachée des Big Tech
- Projets DePIN 2026 : Présentation complète et comparaison
Outils
- Cursor + Gonka AI — LLM pas cher pour le codage
- Claude Code + Gonka AI — LLM pour le terminal
- OpenClaw + Gonka AI — Agents IA accessibles
- OpenCode + Gonka AI — IA gratuite pour le code
- Continue.dev + Gonka AI — IA pour VS Code/JetBrains
- Cline + Gonka AI — Agent IA dans VS Code
- Aider + Gonka AI — programmation en binôme avec l'IA
- LangChain + Gonka AI — Applications IA pour des centimes
- n8n + Gonka AI — Automatisation avec IA pas chère
- Open WebUI + Gonka AI — Votre propre ChatGPT
- LibreChat + Gonka AI — ChatGPT open-source
- API démarrage rapide — curl, Python, TypeScript
- JoinGonka Gateway — présentation complète
- Management Keys — SaaS sur Gonka
- L'API AI la moins chère : comparaison des fournisseurs 2026
- Limite de requêtes Cursor Pro atteinte — diagnostic réel et alternative bon marché
- Alternative moins chère à Claude Code — répartition de la facture et basculement
- Cline a brûlé des dollars — pourquoi l'agent consomme de l'argent
- OpenClaw trop cher — pourquoi l'agent consomme des tokens et comment économiser
- Alternative moins chère à OpenRouter — comparaison avec JoinGonka Gateway
Technologie
Kimi K2.6 : Le deuxième modèle du réseau Gonka
Qu'est-ce que Kimi K2.6 de Moonshot AI
Kimi K2.6 est un grand modèle linguistique (LLM) de la série Kimi, développé par la société pékinoise Moonshot AI. Moonshot AI est l'un des principaux laboratoires d'IA en Chine, fondé en 2023 par une équipe de chercheurs dirigée par Yang Zhilin. L'entreprise a levé des fonds auprès d'Alibaba, Tencent et d'autres grands investisseurs, et figure sur la liste des «tigres de l'IA chinois» — des entreprises qui donnent le ton du développement de l'IA en Asie.
La série Kimi est connue depuis 2024. Les premières versions (K1, K1.5) ont immédiatement attiré l'attention par leur fenêtre contextuelle exceptionnellement longue — jusqu'à 200 000 jetons dans une seule requête, ce qui était un record pour les modèles disponibles publiquement au moment de leur sortie. Un contexte long signifie la possibilité pratique d'analyser un livre entier, une base de code de taille moyenne ou une collection de documents juridiques en une seule requête. Au moment de la sortie de Kimi, cette caractéristique était un avantage concurrentiel majeur.
La version K2 est apparue en 2025 et a apporté un saut architectural fondamental — le passage à MoE (Mixture of Experts). Cette même architecture sous-tend Qwen3-235B et DeepSeek-R1 — elle est devenue la norme de facto pour les plus grands modèles de 2025-2026. MoE permet d'avoir des centaines de milliards de paramètres «au total», mais de n'activer qu'un sous-ensemble (généralement 5-10%) pour chaque requête, ce qui réduit radicalement le coût de calcul de l'inférence tout en maintenant une qualité comparable.
K2.6 est la dernière itération de la série K2 au moment de la rédaction de cet article. Selon les déclarations publiques de Moonshot AI, cette version améliore les capacités de raisonnement du modèle, la génération de code et l'appel d'outils natifs (tool calling). Dans le réseau Gonka, le modèle est identifié comme moonshotai/Kimi-K2.6 — c'est le nom à transmettre dans le champ model de la requête API.
Comparaison entre Kimi K2.6 et Qwen3-235B
Les deux modèles représentent des développements phares des plus grands laboratoires d'IA chinois et sont tous deux accessibles via une interface unique compatible OpenAPI, la JoinGonka Gateway. Cependant, ils présentent des points forts et des héritages différents, ce qui fait que le choix entre eux n'est pas une question de «lequel est le meilleur», mais une question de «lequel convient à la tâche».
| Caractéristique | Kimi K2.6 | Qwen3-235B-A22B |
|---|---|---|
| Fabricant | Moonshot AI (Pékin) | Alibaba Cloud (Hangzhou) |
| Année de fondation de l'entreprise | 2023 | 2009 (Alibaba Cloud) |
| Architecture | MoE | MoE (235B total, 22B actifs) |
| Fenêtre contextuelle | Contexte long (carte de visite de la série Kimi) | 131 072 jetons (~100 000 mots) |
| Point fort | Raisonnement, contexte long, génération de code | Universel, multilingue (119 langues), tool calling stable |
| Prix via JoinGonka | $0.001 pour 1M de jetons | $0.001 pour 1M de jetons |
| Identifiant API | moonshotai/Kimi-K2.6 | Qwen/Qwen3-235B-A22B-Instruct-2507-FP8 |
| Tool calling | En cours de perfectionnement (auto-choice) | Natif, stable (PR #767) |
| Statut dans le réseau Gonka | Lancé via DevShards (mai 2026) | Stable depuis août 2025 |
Sur les benchmarks de raisonnement (MATH-500, GSM8K, AIME), la série Kimi K2 a historiquement affiché des résultats dans le groupe supérieur des modèles open-weights, en compétition avec DeepSeek-R1 et les modèles de style o1. Sur les tâches de génération de code (HumanEval, MBPP), les deux modèles se maintiennent à des niveaux proches. En multilinguisme et traduction, Qwen3-235B a un avantage grâce à son entraînement sur 119 langues, tandis que Kimi est davantage optimisé pour le chinois et l'anglais.
Une mise en garde importante concernant les benchmarks en 2026 : l'écart entre les meilleurs modèles dans les tests publics s'est réduit à quelques pourcentages, et cette différence se situe souvent dans la marge d'erreur statistique des benchmarks eux-mêmes. Pour le travail pratique, ce n'est pas «qui est 2% plus élevé en MMLU» qui compte, mais la nature des tâches : quel contexte vous transmettez au modèle, la complexité des chaînes logiques, la nécessité d'un historique de dialogue long, les langues utilisées. Par conséquent, le tableau ci-dessus ne classe pas les modèles – il aide à comprendre rapidement à quel profil de tâches chacun d'eux est optimisé.
Pour un choix pratique : si la tâche nécessite un contexte long (analyse de gros documents, lecture d'une base de code volumineuse, longs dialogues avec conservation de l'historique) ou des tâches de raisonnement complexes, il faut commencer par Kimi K2.6. Pour les tâches universelles, les traductions, le travail multilingue et un tool calling stable en production, Qwen3-235B semble être une option plus éprouvée, car elle fonctionne plus longtemps dans le réseau Gonka. Une bonne stratégie en production consiste à avoir les deux modèles dans votre code : un changement rapide via le paramètre model permet de basculer entre eux en fonction de la tâche sans modifier l'architecture de l'application.
DevShards : comment Gonka a lancé le second modèle
Jusqu'au printemps 2026, l'ensemble du réseau Gonka servait un seul modèle – Qwen3-235B. Du point de vue architectural, c'était une décision judicieuse : l'inférence distribuée via DiLoCo exige que tous les participants du réseau gardent le même modèle en mémoire vidéo, sinon il est impossible de garantir que n'importe quel nœud pourra traiter n'importe quelle requête. La Qwen3-235B complète au format FP8 occupe environ 640 Go de VRAM, ce qui est déjà en soi une énorme contrainte pour chaque nœud ML.
Pour passer à un réseau multi-modèle, il fallait un mécanisme permettant de maintenir plusieurs modèles simultanément, sans exiger que chaque hôte les exécute tous. Ce mécanisme a été baptisé DevShards — des shards de réseau distincts, chacun spécialisé dans un modèle. Les nœuds au sein d'un même shard travaillent sur le même modèle, et le routeur réseau dirige la requête vers le shard avec le modèle approprié.
L'idée ne vient pas de nulle part — elle a été formalisée dans la Gonka Improvement Proposal #800 «Multi-Model PoC», soumise au vote de la communauté au printemps 2026. La proposition a reçu le soutien des participants et des validateurs du réseau et a été mise en œuvre en avril-mai 2026. Kimi K2.6 est devenu le premier modèle lancé sur un DevShard séparé — c'est-à-dire, en fait, une implémentation test de la nouvelle approche. Si l'expérience s'avère concluante, rien n'empêche de lancer un troisième, un quatrième, etc. — chacun sur son propre shard, avec son propre ensemble d'hôtes, sa propre économie et sa propre feuille de route.
Qu'est-ce que cela signifie pour les utilisateurs et les développeurs :
- Une seule API — plusieurs modèles. Via JoinGonka Gateway, il n'est pas nécessaire de changer le point de terminaison ou les clés : il suffit de spécifier un autre
modeldans le corps de la requête. Le format compatible OpenAI est entièrement conservé. - Le prix est le même. Actuellement, Kimi K2.6 est facturé au même taux que Qwen3-235B dans le réseau — 0,001 $ pour 1M de jetons via le Gateway. À l'avenir, les prix peuvent différer selon les modèles, mais une tarification uniforme au démarrage est une décision consciente pour simplifier la migration des utilisateurs.
- La stabilité dépend de la charge du shard. Au début, le shard Kimi dispose de moins d'hôtes que le shard principal Qwen, donc en cas de concentration de requêtes, le modèle peut temporairement renvoyer
429 too many concurrent requests. C'est une phase normale pour un nouveau modèle — à mesure que l'intérêt augmente, les hôtes se connecteront au shard Kimi, et les limites augmenteront. - Tool calling — en cours de perfectionnement. Au moment de la rédaction de cet article, Kimi K2.6 dans le réseau Gonka présente de petits problèmes avec la sélection automatique des outils (
tool_choice: "auto"). L'équipe Gonka travaille à harmoniser le comportement avec la norme OpenAI ; pour les scénarios critiques en production avec du tool calling, il est recommandé d'utiliser Qwen3-235B pour le moment.
Comment essayer Kimi K2.6 via Gonka
Le moyen le plus direct est via la JoinGonka API Gateway. La Gateway fournit une API compatible OpenAI, ce qui signifie que le même code qui fonctionne avec GPT, Claude ou Qwen fonctionnera avec Kimi après avoir modifié la valeur du champ model dans le corps de la requête.
Un exemple minimal via curl :
curl https://gate.joingonka.ai/v1/chat/completions \
-H "Authorization: Bearer YOUR_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "moonshotai/Kimi-K2.6",
"messages": [
{"role": "user", "content": "Explique la différence entre les modèles MoE et dense"}
]
}'La même requête avec Python via la bibliothèque openai :
from openai import OpenAI
client = OpenAI(
api_key="YOUR_API_KEY",
base_url="https://gate.joingonka.ai/v1",
)
response = client.chat.completions.create(
model="moonshotai/Kimi-K2.6",
messages=[{"role": "user", "content": "Bonjour, Kimi"}],
)
print(response.choices[0].message.content)Streaming (Server-Sent Events) — pour les interfaces interactives et les chats où la réponse doit être affichée au fur et à mesure de sa génération :
stream = client.chat.completions.create(
model="moonshotai/Kimi-K2.6",
messages=[{"role": "user", "content": "Écris un essai sur MoE"}],
stream=True,
)
for chunk in stream:
delta = chunk.choices[0].delta.content
if delta:
print(delta, end="", flush=True)Le coût de Kimi K2.6 est de 0,001 $ pour 1 million de jetons, soit le même prix que Qwen3-235B. C'est environ 2 500 fois moins cher que GPT-5.4 et environ 3 000 fois moins cher que Claude Sonnet 4.5. Lors de l'inscription à JoinGonka Gateway, vous recevez 10 millions de jetons gratuits pour tester tous les modèles du réseau — cela suffit pour plusieurs heures de travail intense ou des dizaines de milliers de requêtes ordinaires.
Compatibilité avec les outils de développement : tout ce qui fonctionne avec l'API OpenAI fonctionne également avec Kimi via la Gateway. Au niveau du modèle, il suffit de changer le paramètre model :
- Cursor : dans les paramètres du modèle personnalisé, indiquez
moonshotai/Kimi-K2.6 - Claude Code : variable d'environnement
ANTHROPIC_MODELou drapeau--model - OpenClaw, Cline, Continue.dev : dans la configuration du CustomChatModel, changez le nom du modèle
- LangChain, n8n : paramètre
modeldans l'initialisation du client - Open WebUI, LibreChat : le modèle apparaît dans la liste déroulante après l'ajout de Gonka en tant que fournisseur personnalisé
La liste des modèles disponibles est toujours à jour dans l'endpoint GET /v1/models de votre instance Gateway — il est pratique de la récupérer dynamiquement dans l'interface utilisateur de votre application afin que les utilisateurs puissent voir la liste complète et choisir le modèle eux-mêmes.
Le chat de démonstration sur la page /try ne fonctionne qu'avec Qwen3-235B au moment de la publication — le sélecteur multi-modèles dans le widget est en cours de développement. Pour essayer Kimi dès maintenant, utilisez l'API Gateway : les 10 millions de jetons gratuits suffiront pour plusieurs heures d'expérimentation. Si la réponse est 429 too many concurrent requests — c'est une phase normale pour un nouveau modèle aux premiers stades de la croissance du réseau Gonka. Il suffit de répéter la requête après quelques secondes ou d'attendre une fenêtre de moindre charge.
Et pour la suite du réseau Gonka : le succès de DevShards pour Kimi ouvre la voie à d'autres modèles. Les discussions de la communauté mentionnent DeepSeek-V3/R1, Llama 4 et des modèles spécialisés pour le code. Chaque nouveau modèle est un nouveau shard, de nouveaux hôtes, de nouvelles opportunités pour les utilisateurs et une nouvelle source de revenus pour les fournisseurs de GPU. L'architecture multi-modèles est également stratégiquement importante : un réseau lié à un seul modèle est fondamentalement fragile (une nouvelle version entraîne une crise de migration), tandis qu'un réseau capable de maintenir plusieurs modèles simultanément évolue en douceur et en continu.
Vous voulez en savoir plus ?
Explorez d'autres sections ou commencez à gagner des GNK dès maintenant.
Essayer Kimi K2.6 via Gateway →