Kimi K2.6: গংকা নেটওয়ার্কের দ্বিতীয় মডেল

দীর্ঘ সময় ধরে Gonka নেটওয়ার্ক একটি মাত্র মডেলের ওপর ভিত্তি করে চলত — Alibaba Cloud-এর Qwen3-235B। ২০২৬ সালের মে মাসে এটি পরিবর্তিত হয়: DevShards মেকানিজমের মাধ্যমে একাধিক মডেলের সমর্থন চালু করা হয় এবং এর প্রথম সংযোজন ছিল চীনা কোম্পানি Moonshot AI-এর Kimi K2.6। পরবর্তীতে এতে MiniMax M2.7 যোগ করা হয় এবং সময়ের সাথে সাথে Qwen3-235B নেটওয়ার্ক থেকে সরিয়ে ফেলা হয় — বর্তমানে Gonka দুটি মডেল পরিচালনা করে: Kimi K2.6 এবং MiniMax M2.7। নিচে আলোচনা করা হলো এই মডেলটি কী, MiniMax M2.7 থেকে এটি কীভাবে আলাদা, Gonka কীভাবে প্রযুক্তিগতভাবে মাল্টি-মডেল সাপোর্ট কার্যকর করেছে এবং আমাদের API Gateway-এর মাধ্যমে এটি কীভাবে ব্যবহার করবেন।

Moonshot AI থেকে Kimi K2.6 কী?

Kimi K2.6 হল Kimi সিরিজের একটি বৃহৎ ভাষার মডেল (LLM), যা বেইজিং-এর কোম্পানি Moonshot AI দ্বারা তৈরি। Moonshot AI হল চীনের অন্যতম প্রধান এআই ল্যাব, যা 2023 সালে Yang Zhilin-এর নেতৃত্বে গবেষকদের একটি দল দ্বারা প্রতিষ্ঠিত। কোম্পানিটি আলিবাবা, টেনসেন্ট এবং অন্যান্য বৃহৎ বিনিয়োগকারীদের কাছ থেকে তহবিল সংগ্রহ করেছে এবং “চীনা এআই টাইগার্স” – এশিয়াতে এআই-এর বিকাশের গতি নির্ধারণকারী কোম্পানিগুলির তালিকায় স্থান পেয়েছে।

Kimi সিরিজ 2024 সাল থেকে পরিচিত। প্রথম সংস্করণগুলি (K1, K1.5) অবিলম্বে তাদের অত্যন্ত দীর্ঘ প্রসঙ্গ উইন্ডোর জন্য দৃষ্টি আকর্ষণ করেছিল – একটি একক অনুরোধে 200,000 পর্যন্ত টোকেন, যা প্রকাশের সময় সর্বজনীনভাবে উপলব্ধ মডেলগুলির জন্য একটি রেকর্ড ছিল। দীর্ঘ প্রসঙ্গ মানে একটি একক অনুরোধে একটি সম্পূর্ণ বই, মাঝারি আকারের কোডবেস বা আইনি নথির একটি নির্বাচন বিশ্লেষণ করার ব্যবহারিক সম্ভাবনা। Kimi প্রকাশের সময় এই বৈশিষ্ট্যটি একটি শক্তিশালী প্রতিযোগিতামূলক সুবিধা ছিল।

K2 সংস্করণটি 2025 সালে এসেছিল এবং একটি মৌলিক কাঠামোগত লাফ এনেছিল – MoE (Mixture of Experts)-এ রূপান্তর। এই একই আর্কিটেকচার Qwen3-235B এবং DeepSeek-R1-এর ভিত্তি তৈরি করে – এটি 2025-2026 সালের বৃহত্তম মডেলগুলির জন্য একটি বাস্তব মান হয়ে উঠেছে। MoE শত শত বিলিয়ন প্যারামিটার “সব” থাকার অনুমতি দেয়, কিন্তু প্রতিটি অনুরোধে শুধুমাত্র একটি উপসেট (সাধারণত 5-10%) সক্রিয় করে, যা তুলনামূলক গুণমানের সাথে ইনফারেন্সের গণনা খরচকে নাটকীয়ভাবে হ্রাস করে।

K2.6 এই লেখার সময় K2 সিরিজের সর্বশেষ পুনরাবৃত্তি। Moonshot AI-এর জন বিবৃতিতে বলা হয়েছে যে এই সংস্করণে মডেলের কারণ (যৌক্তিক যুক্তি), কোড জেনারেশন এবং নেটিভ টুল কলিং ক্ষমতা উন্নত করা হয়েছে। গংকা নেটওয়ার্কে মডেলটিকে moonshotai/Kimi-K2.6 হিসাবে চিহ্নিত করা হয়েছে – এটিই API অনুরোধের modelA ফিল্ডে পাস করতে হবে।

Kimi K2.6 এবং MiniMax M2.7-এর তুলনা

উভয় মডেলই চীনের বৃহত্তম AI ল্যাবগুলোর ফ্ল্যাগশিপ সংস্করণ এবং উভয়ই একটি统一 OpenAI-সামঞ্জস্যপূর্ণ ইন্টারফেস JoinGonka Gateway-এর মাধ্যমে অ্যাক্সেসযোগ্য। এদের আলাদা শক্তিশালী দিক এবং ঐতিহ্য রয়েছে, যার ফলে এগুলোর মধ্যে নির্বাচন করা "কোনটি ভালো" তা নয়, বরং "কোনটি নির্দিষ্ট কাজের জন্য উপযুক্ত" তা বেছে নেওয়ার বিষয়।

বৈশিষ্ট্য	Kimi K2.6	MiniMax M2.7
প্রস্তুতকারক	Moonshot AI (বেইজিং)	MiniMax (সাংহাই)
প্রতিষ্ঠার বছর	২০২৩	২০২১
আর্কিটেকচার	MoE	MoE + লিনিয়ার attention
কনটেক্সট উইন্ডো	200,000 টোকেন	200,000 টোকেন
শক্তিশালী দিক	Reasoning, দীর্ঘ কনটেক্সট, code generation	দীর্ঘ কনটেক্সট, দক্ষ (লিনিয়ার) attention
JoinGonka মূল্যের হার	প্রতি 1M টোকেনে $0.003	প্রতি 1M টোকেনে $0.003
API আইডেন্টিফায়ার	`moonshotai/Kimi-K2.6`	`MiniMaxAI/MiniMax-M2.7`
Gonka নেটওয়ার্কে স্ট্যাটাস	DevShards-এর মাধ্যমে লঞ্চ করা হয়েছে (মে ২০২৬)	v0.2.13 আপগ্রেডের মাধ্যমে লঞ্চ করা হয়েছে (মে ২০২৬)

Reasoning বেঞ্চমার্কে (MATH-500, GSM8K, AIME) Kimi K2 সিরিজ ঐতিহাসিকভাবে open-weights মডেলগুলোর মধ্যে উপরের সারিতে রয়েছে এবং DeepSeek-R1 ও o1-স্টাইল মডেলগুলোর সাথে প্রতিদ্বন্দ্বিতা করে। কোড জেনারেশন টাস্কে (HumanEval, MBPP) উভয় মডেলই প্রায় একই স্তরে অবস্থান করে। MiniMax M2.7-এর শক্তিশালী দিক হলো দীর্ঘ সিকোয়েন্সের জন্য এর দক্ষ (লিনিয়ার) attention, যেখানে Kimi তার শক্তিশালী reasoning এবং দীর্ঘ কনটেক্সট সিরিজের জন্য পরিচিত।

২০২৬ সালের বেঞ্চমার্কের বিষয়ে একটি গুরুত্বপূর্ণ সতর্কতা: পাবলিক টেস্টে শীর্ষ মডেলগুলোর মধ্যে ব্যবধান সামান্য শতাংশে নেমে এসেছে এবং এই পার্থক্য অনেক সময় বেঞ্চমার্কের নিজস্ব পরিসংখ্যানগত ত্রুটির মধ্যেই থাকে। ব্যবহারিক কাজের জন্য "কে MMLU-তে ২% বেশি" তা গুরুত্বপূর্ণ নয়, বরং কাজের প্রকৃতি গুরুত্বপূর্ণ: আপনি মডেলে কী কনটেক্সট দিচ্ছেন, লজিক্যাল চেইন কতটা জটিল, দীর্ঘ ডায়ালগ ইতিহাস প্রয়োজন কি না এবং কোন ভাষা ব্যবহার হচ্ছে। তাই উপরের টেবিলটি মডেলগুলোর কোনো র‍্যাঙ্কিং নয় — এটি প্রতিটি মডেল কোন ধরনের টাস্কের জন্য অপ্টিমাইজ করা হয়েছে তা দ্রুত বোঝার জন্য একটি নির্দেশিকা মাত্র।

ব্যবহারিক নির্বাচনের ক্ষেত্রে: যদি কোনো কাজে দীর্ঘ কনটেক্সট (বড় ডকুমেন্টের বিশ্লেষণ, বিশাল কোডবেস পড়া, ইতিহাসসহ দীর্ঘ ডায়ালগ) বা জটিল reasoning-এর প্রয়োজন হয়, তবে Kimi K2.6 দিয়ে শুরু করা উচিত। যদি খুব দীর্ঘ ইনপুট সিকোয়েন্স এবং স্ট্রিমিং ডেটা প্রসেসিং অগ্রাধিকার পায়, তবে এর দক্ষ attention-এর জন্য MiniMax M2.7 পরীক্ষা করে দেখা উচিত। প্রোডাকশনে একটি ভালো কৌশল হলো উভয় মডেল ব্যবহার করা: model প্যারামিটারের মাধ্যমে দ্রুত পরিবর্তন করে অ্যাপ্লিকেশনের আর্কিটেকচার পরিবর্তন না করেই প্রয়োজন অনুযায়ী মডেলগুলোর মধ্যে সুইচ করা যায়।

DevShards: গংকা কীভাবে দ্বিতীয় মডেলটি চালু করেছে

২০২৬ সালের বসন্ত পর্যন্ত, পুরো Gonka নেটওয়ার্ক ঠিক একটি মডেল পরিচালনা করত — Qwen3-235B। আর্কিটেকচারের দিক থেকে এটি একটি যুক্তিযুক্ত সিদ্ধান্ত ছিল: distributed inference DiLoCo-এর মাধ্যমে নিশ্চিত করে যে নেটওয়ার্কের সমস্ত অংশগ্রহণকারীকে একই VRAM-এ মডেলটি রাখতে হবে, নতুবা এটি নিশ্চিত করা অসম্ভব যে যেকোনো নোড যেকোনো অনুরোধ প্রক্রিয়া করতে পারবে। FP8 ফরম্যাটে সম্পূর্ণ Qwen3-235B প্রায় ৬৪০ জিবি VRAM গ্রহণ করে, যা প্রতিটি ML-ноды-এর জন্য একটি বিশাল প্রতিশ্রুতি।

একটি মাল্টি-মডেল নেটওয়ার্কে স্থানান্তরের জন্য এমন একটি মেকানিজমের প্রয়োজন ছিল যা একাধিক মডেলকে একই সময়ে ধরে রাখতে পারে, কিন্তু প্রতিটি হোস্টকে সেগুলোর সব চালু করার প্রয়োজন নেই। এই মেকানিজমটি হলো DevShards — নেটওয়ার্কের পৃথক শার্ড, যার প্রতিটি একটি মডেলের উপর বিশেষজ্ঞ। একই শার্ডের ভেতর নোডগুলো একটি মডেলের ওপর কাজ করে এবং নেটওয়ার্ক রাউটার সঠিক মডেলসহ শার্ডে অনুরোধ পাঠায়।

এই ধারণাটি এমনি আসেনি — এটি Gonka Improvement Proposal #800 «Multi-Model PoC»-এ আনুষ্ঠানিক করা হয়েছিল, যা ২০২৬ সালের বসন্তে সম্প্রদায়ের ভোটের জন্য উত্থাপিত হয়। প্রস্তাবটি নেটওয়ার্কের অংশগ্রহণকারী এবং ভ্যালিডেটরদের সমর্থন লাভ করে এবং ২০২৬ সালের এপ্রিল-মে মাসে এটি বাস্তবায়িত হয়। Kimi K2.6 প্রথম মডেল হিসেবে নিজস্ব DevShard-এ চালু হয় — অর্থাৎ কার্যত নতুন পদ্ধতির একটি পরীক্ষামূলক বাস্তবায়ন। যদি এই অভিজ্ঞতা সফল হয়, তবে তৃতীয়, চতুর্থ এবং পরবর্তী মডেল চালু করতে কোনো সমস্যা নেই — প্রতিটি তাদের নিজস্ব শার্ড, নিজস্ব হোস্ট, নিজস্ব অর্থনীতি এবং নিজস্ব roadmap নিয়ে।

ব্যবহারকারী এবং ডেভেলপারদের জন্য এর অর্থ:

একটি API — একাধিক মডেল। JoinGonka Gateway-এর মাধ্যমে endpoint বা কী পরিবর্তনের প্রয়োজন নেই: অনুরোধের বডিতে শুধু একটি ভিন্ন model উল্লেখ করলেই চলে। OpenAI-সামঞ্জস্যপূর্ণ ফরম্যাট সম্পূর্ণ বজায় থাকে।
মূল্য একই। বর্তমানে নেটওয়ার্কে Kimi K2.6-এর মূল্য নির্ধারণ করা হয়েছে MiniMax M2.7-এর মতো — Gateway-এর মাধ্যমে প্রতি ১ মিলিয়ন টোকেনের জন্য $০.০০৩। ভবিষ্যতে মডেল অনুযায়ী দাম ভিন্ন হতে পারে, তবে শুরুতে একক প্রাইসিং রাখা হয়েছে ব্যবহারকারীদের মাইগ্রেশন সহজ করার জন্য।
স্থিতিশীলতা শার্ডের লোডের উপর নির্ভর করে। প্রাথমিক পর্যায়ে একটি নতুন মডেলের শার্ডে কম হোস্ট থাকে, তাই অনুরোধের ঘনত্বের কারণে মডেলটি সাময়িকভাবে 429 too many concurrent requests এরর দিতে পারে। এটি একটি নতুন মডেলের জন্য স্বাভাবিক পর্যায় — আগ্রহ বাড়ার সাথে সাথে হোস্টগুলো শার্ডের সাথে যুক্ত হবে এবং সীমা বৃদ্ধি পাবে।
Tool calling — প্রক্রিয়াধীন। নিবন্ধটি লেখার সময় পর্যন্ত, Gonka নেটওয়ার্কে Kimi K2.6-এর ক্ষেত্রে স্বয়ংক্রিয় টুল নির্বাচনের (tool_choice: "auto") ক্ষেত্রে ছোটখাটো সমস্যা পরিলক্ষিত হচ্ছে। Gonka টিম এর আচরণকে OpenAI স্ট্যান্ডার্ডে আনার জন্য কাজ করছে; প্রোডাকশন স্ক্রিপ্টে tool calling ব্যবহারের ক্ষেত্রে আপনার অনুরোধগুলোতে মডেলটির আচরণ আগেই পরীক্ষা করে নিন।

গংকা এর মাধ্যমে Kimi K2.6 কীভাবে পরীক্ষা করবেন

সবচেয়ে সহজ উপায় হলো JoinGonka API Gateway এর মাধ্যমে। Gateway একটি OpenAI-সামঞ্জস্যপূর্ণ API প্রদান করে, যার মানে হলো: যে কোডটি GPT, Claude বা অন্যান্য মডেলের সাথে কাজ করে, সেটি অনুরোধের বডিতে model ফিল্ডের মান পরিবর্তন করার পর Kimi এর সাথে কাজ করা শুরু করবে।

curl এর মাধ্যমে একটি ন্যূনতম উদাহরণ:

curl https://gate.joingonka.ai/v1/chat/completions \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "moonshotai/Kimi-K2.6",
    "messages": [
      {"role": "user", "content": "MoE এবং dense মডেলের মধ্যে পার্থক্য ব্যাখ্যা করো"}
    ]
  }'

openai লাইব্রেরি ব্যবহার করে Python-এ একই অনুরোধ:

from openai import OpenAI

client = OpenAI(
    api_key="YOUR_API_KEY",
    base_url="https://gate.joingonka.ai/v1",
)

response = client.chat.completions.create(
    model="moonshotai/Kimi-K2.6",
    messages=[{"role": "user", "content": "হ্যালো, Kimi"}],
)
print(response.choices[0].message.content)

স্ট্রিমিং (Server-Sent Events) — ইন্টারঅ্যাক্টিভ ইন্টারফেস এবং চ্যাটের জন্য যেখানে জেনারেশনের সাথে সাথে উত্তর দেখাতে চান:

stream = client.chat.completions.create(
    model="moonshotai/Kimi-K2.6",
    messages=[{"role": "user", "content": "MoE সম্পর্কে একটি প্রবন্ধ লেখো"}],
    stream=True,
)
for chunk in stream:
    delta = chunk.choices[0].delta.content
    if delta:
        print(delta, end="", flush=True)

Kimi K2.6 এর খরচ হলো প্রতি ১ মিলিয়ন টোকেনে মাত্র $0.003, যা নেটওয়ার্কের জন্য একটি সমজাতীয় রেট। এটি GPT-5.5 এর তুলনায় প্রায় ১,৭০০ গুণ এবং Claude Sonnet 4.6 এর তুলনায় প্রায় ১,০০০ গুণ সস্তা। JoinGonka Gateway-তে নিবন্ধন করার মাধ্যমে আপনি নেটওয়ার্কের যেকোনো মডেল পরীক্ষা করার জন্য ১০ মিলিয়ন টোকেন বিনামূল্যে পাবেন — যা কয়েক ঘণ্টার নিবিড় কাজ বা কয়েক হাজার সাধারণ অনুরোধের জন্য যথেষ্ট।

ডেভেলপমেন্ট টুলের সাথে সামঞ্জস্যতা: OpenAI API এর সাথে কাজ করা সবকিছুই Gateway-এর মাধ্যমে Kimi-এর সাথে কাজ করে। মডেল লেভেলে শুধুমাত্র model প্যারামিটারটি পরিবর্তন করা যথেষ্ট:

Cursor: Custom Model সেটিংসে moonshotai/Kimi-K2.6 উল্লেখ করুন
Claude Code: ANTHROPIC_MODEL এনভায়রনমেন্ট ভেরিয়েবল বা --model ফ্ল্যাগ ব্যবহার করুন
OpenClaw, Cline, Continue.dev: CustomChatModel কনফিগারেশনে মডেলের নাম পরিবর্তন করুন
LangChain, n8n: ক্লায়েন্ট ইনিশিয়ালাইজেশনে model প্যারামিটার ব্যবহার করুন
Open WebUI, LibreChat: কাস্টম প্রোভাইডার হিসেবে Gonka যোগ করার পর মডেলটি ড্রপডাউন লিস্টে দেখা যাবে

উপলব্ধ মডেলের তালিকা সর্বদা আপনার Gateway-ইনস্ট্যান্সের GET /v1/models এন্ডপয়েন্টে পাওয়া যায় — আপনার অ্যাপ্লিকেশনের UI-তে এটি ডাইনামিকভাবে যুক্ত করা সহজ, যাতে ব্যবহারকারীরা সম্পূর্ণ তালিকা দেখে নিজেদের পছন্দের মডেল নির্বাচন করতে পারেন।

আমাদের /try পেজের ডেমো চ্যাট বর্তমানে নেটওয়ার্কের অন্যতম সক্রিয় মডেল ব্যবহার করছে — উইজেটে মাল্টি-মডেল সিলেক্টর আমাদের রোডম্যাপে রয়েছে। Kimi সরাসরি পরীক্ষা করতে Gateway API ব্যবহার করুন: ১০M ফ্রি টোকেন কয়েক ঘণ্টার পরীক্ষার জন্য যথেষ্ট। যদি 429 too many concurrent requests ত্রুটি পান, তবে এটি Gonka নেটওয়ার্কের প্রারম্ভিক বর্ধনশীল পর্যায়ের একটি স্বাভাবিক বিষয়। কয়েক সেকেন্ড পরে আবার চেষ্টা করুন অথবা নেটওয়ার্কের লোড কমে যাওয়া পর্যন্ত অপেক্ষা করুন।

Gonka নেটওয়ার্কের পরবর্তী ধাপ: Kimi-এর জন্য DevShards-এর সাফল্য অন্যান্য মডেলের পথ প্রশস্ত করছে। কমিউনিটির আলোচনায় DeepSeek-V3/R1, Llama 4 এবং কোডিংয়ের জন্য বিশেষায়িত মডেলগুলোর কথা উঠে আসছে। প্রতিটি নতুন মডেল মানে নতুন শার্ড, নতুন হোস্ট, ব্যবহারকারীদের জন্য নতুন সুযোগ এবং GPU প্রোভাইডারদের জন্য আয়ের নতুন উৎস। মাল্টি-মডেল আর্কিটেকচারটি কৌশলগতভাবেও গুরুত্বপূর্ণ: একটি একক মডেলের ওপর নির্ভরশীল নেটওয়ার্ক মূলত ভঙ্গুর (নতুন ভার্সন রিলিজ মানেই মাইগ্রেশনের সংকট), অন্যদিকে যে নেটওয়ার্ক একই সাথে একাধিক মডেল পরিচালনা করতে সক্ষম, তা নমনীয় এবং স্থিতিশীল।

OpenRouter-এর মাধ্যমে একই Kimi K2.6 এর জন্য খরচ হয় প্রতি ১M টোকেনে $0.684/$3.42, যেখানে JoinGonka তে তা মাত্র $0.003 (শতগুণ বেশি সাশ্রয়ী)।

Kimi K2.6 হলো Moonshot AI-এর একটি MoE-মডেল যার দীর্ঘ কনটেক্সট এবং শক্তিশালী reasoning ক্ষমতা রয়েছে। ২০২৬ সালের মে মাসে, DevShards মেকানিজমের (মডেল প্রতি আলাদা শার্ড) মাধ্যমে লঞ্চ করা Qwen3-235B-এর পর এটি Gonka নেটওয়ার্কের দ্বিতীয় মডেল হিসেবে যুক্ত হয়। JoinGonka Gateway এর মাধ্যমে এটি OpenAI-সামঞ্জস্যপূর্ণ API-এর মাধ্যমে প্রতি ১ মিলিয়ন টোকেনে $0.003 খরচে উপলব্ধ — যা নেটওয়ার্কের একক রেট। API-তে মডেল সনাক্তকারী: moonshotai/Kimi-K2.6। প্রাথমিক পর্যায়ে রিকোয়েস্টের চাপে মাঝে মাঝে 429 ত্রুটি হতে পারে; tool calling ফিচারটি উন্নতির পর্যায়ে রয়েছে।

← Qwen3-235B: যে মডেলটি আগে Gonka সার্ভিস দিতো MiniMax M2.7: Gonka নেটওয়ার্কের মডেল →

আরও জানতে চান?

অন্যান্য বিভাগগুলি অন্বেষণ করুন অথবা এখনই GNK উপার্জন শুরু করুন।

গেটওয়ের মাধ্যমে Kimi K2.6 পরীক্ষা করুন →