জ্ঞানকোষের বিভাগসমূহ ▾

বিনিয়োগকারীদের জন্য

সরঞ্জাম

প্রযুক্তি

Kimi K2.6: গংকা নেটওয়ার্কের দ্বিতীয় মডেল

দীর্ঘ সময় ধরে গংকা নেটওয়ার্ক একটি মডেলের উপর কাজ করছিল – আলিবাবা ক্লাউডের Qwen3-235B। মে 2026-এ এটি পরিবর্তিত হয়েছে: DevShards মেকানিজমের মাধ্যমে একাধিক মডেলের জন্য সমর্থন চালু করা হয়েছে, এবং প্রথমটি আসে চীনা কোম্পানি Moonshot AI থেকে Kimi K2.6। আমরা বিশ্লেষণ করব এই মডেলটি কী, Qwen3-235B থেকে এটি কীভাবে আলাদা, গংকা কীভাবে প্রযুক্তিগতভাবে মাল্টি-মডেল ক্ষমতা বাস্তবায়ন করেছে এবং আমাদের API গেটওয়ের মাধ্যমে নতুন মডেলটি কীভাবে ব্যবহার করা যায়।

Moonshot AI থেকে Kimi K2.6 কী?

Kimi K2.6 হল Kimi সিরিজের একটি বৃহৎ ভাষার মডেল (LLM), যা বেইজিং-এর কোম্পানি Moonshot AI দ্বারা তৈরি। Moonshot AI হল চীনের অন্যতম প্রধান এআই ল্যাব, যা 2023 সালে Yang Zhilin-এর নেতৃত্বে গবেষকদের একটি দল দ্বারা প্রতিষ্ঠিত। কোম্পানিটি আলিবাবা, টেনসেন্ট এবং অন্যান্য বৃহৎ বিনিয়োগকারীদের কাছ থেকে তহবিল সংগ্রহ করেছে এবং “চীনা এআই টাইগার্স” – এশিয়াতে এআই-এর বিকাশের গতি নির্ধারণকারী কোম্পানিগুলির তালিকায় স্থান পেয়েছে।

Kimi সিরিজ 2024 সাল থেকে পরিচিত। প্রথম সংস্করণগুলি (K1, K1.5) অবিলম্বে তাদের অত্যন্ত দীর্ঘ প্রসঙ্গ উইন্ডোর জন্য দৃষ্টি আকর্ষণ করেছিল – একটি একক অনুরোধে 200,000 পর্যন্ত টোকেন, যা প্রকাশের সময় সর্বজনীনভাবে উপলব্ধ মডেলগুলির জন্য একটি রেকর্ড ছিল। দীর্ঘ প্রসঙ্গ মানে একটি একক অনুরোধে একটি সম্পূর্ণ বই, মাঝারি আকারের কোডবেস বা আইনি নথির একটি নির্বাচন বিশ্লেষণ করার ব্যবহারিক সম্ভাবনা। Kimi প্রকাশের সময় এই বৈশিষ্ট্যটি একটি শক্তিশালী প্রতিযোগিতামূলক সুবিধা ছিল।

K2 সংস্করণটি 2025 সালে এসেছিল এবং একটি মৌলিক কাঠামোগত লাফ এনেছিল – MoE (Mixture of Experts)-এ রূপান্তর। এই একই আর্কিটেকচার Qwen3-235B এবং DeepSeek-R1-এর ভিত্তি তৈরি করে – এটি 2025-2026 সালের বৃহত্তম মডেলগুলির জন্য একটি বাস্তব মান হয়ে উঠেছে। MoE শত শত বিলিয়ন প্যারামিটার “সব” থাকার অনুমতি দেয়, কিন্তু প্রতিটি অনুরোধে শুধুমাত্র একটি উপসেট (সাধারণত 5-10%) সক্রিয় করে, যা তুলনামূলক গুণমানের সাথে ইনফারেন্সের গণনা খরচকে নাটকীয়ভাবে হ্রাস করে।

K2.6 এই লেখার সময় K2 সিরিজের সর্বশেষ পুনরাবৃত্তি। Moonshot AI-এর জন বিবৃতিতে বলা হয়েছে যে এই সংস্করণে মডেলের কারণ (যৌক্তিক যুক্তি), কোড জেনারেশন এবং নেটিভ টুল কলিং ক্ষমতা উন্নত করা হয়েছে। গংকা নেটওয়ার্কে মডেলটিকে moonshotai/Kimi-K2.6 হিসাবে চিহ্নিত করা হয়েছে – এটিই API অনুরোধের modelA ফিল্ডে পাস করতে হবে।

Kimi K2.6 এবং Qwen3-235B এর তুলনা

উভয় মডেলই চীনের বৃহত্তম এআই ল্যাবরেটরিগুলির ফ্ল্যাগশিপ ডেভেলপমেন্টগুলি উপস্থাপন করে এবং উভয়ই একটি একক OpenAI-সামঞ্জস্যপূর্ণ ইন্টারফেস JoinGonka Gateway এর মাধ্যমে উপলব্ধ। একই সময়ে, তাদের বিভিন্ন শক্তি এবং বিভিন্ন ঐতিহ্য রয়েছে, যা তাদের মধ্যে পছন্দকে “কোনটি14 সেরা” এর প্রশ্ন নয়, বরং “কোনটি22 কাজের জন্য উপযুক্ত” এর প্রশ্ন করে তোলে।

বৈশিষ্ট্যKimi K2.6Qwen3-235B-A22B
প্রস্তুতকারকMoonshot AI (বেইজিং)Alibaba Cloud (হাংঝৌ)
কোম্পানির প্রতিষ্ঠার বছর20232009 (Alibaba Cloud)
আর্কিটেকচারMoEMoE (235B মোট, 22B সক্রিয়)
প্রসঙ্গ উইন্ডোদীর্ঘ প্রসঙ্গ (Kimi সিরিজের ট্রেডমার্ক)131,072 টোকেন (~100,000 শব্দ)
শক্তিশালী দিকযুক্তি, দীর্ঘ প্রসঙ্গ, কোড জেনারেশনসর্বজনীন, বহুভাষিকতা (119 ভাষা), স্থিতিশীল টুল কলিং
JoinGonka এর মাধ্যমে মূল্য1M টোকেনের জন্য $0.0011M টোকেনের জন্য $0.001
API শনাক্তকারীmoonshotai/Kimi-K2.6Qwen/Qwen3-235B-A22B-Instruct-2507-FP8
টুল কলিংউন্নয়নের পর্যায়ে (auto-choice)নেটিভ, স্থিতিশীল (PR #767)
গংকা নেটওয়ার্কে স্থিতিDevShards এর মাধ্যমে চালু হয়েছে (মে 2026)আগস্ট 2025 থেকে স্থিতিশীল

2026 সালে বেঞ্চমার্ক সম্পর্কে একটি গুরুত্বপূর্ণ নোট: পাবলিক পরীক্ষায় শীর্ষ মডেলগুলির মধ্যে ব্যবধান মাত্র কয়েক শতাংশে নেমে এসেছে, এবং এই পার্থক্য প্রায়শই বেঞ্চমার্কের পরিসংখ্যানগত ত্রুটির সীমার মধ্যে থাকে। ব্যবহারিক কাজের জন্য, “MMLU তে কে 2% বেশি” তা নয়, বরং কাজের প্রকৃতি গুরুত্বপূর্ণ: আপনি মডেলটিতে কোন প্রসঙ্গটি পাস করছেন, যৌক্তিক চেইনগুলি কতটা জটিল, একটি দীর্ঘ কথোপকথনের ইতিহাস প্রয়োজন কিনা, কোন ভাষা ব্যবহার করা হয়। তাই উপরের সারণীটি মডেলগুলিকে র‍্যাঙ্ক করে না – এটি দ্রুত বুঝতে সাহায্য করে যে তাদের মধ্যে কোনটি22 কোন ধরনের কাজের জন্য অপ্টিমাইজ করা হয়েছে।

ব্যবহারিক পছন্দের জন্য: যদি কাজটি দীর্ঘ প্রসঙ্গ (বড় ডকুমেন্ট বিশ্লেষণ, বিশাল কোডবেস পড়া, ইতিহাস সংরক্ষণ সহ দীর্ঘ কথোপকথন) বা জটিল যুক্তির কাজগুলির প্রয়োজন হয় – Kimi K2.6 দিয়ে শুরু করা উচিত। সর্বজনীন কাজ, অনুবাদ, বহুভাষিক কাজ এবং উৎপাদনে স্থিতিশীল টুল কলিং এর জন্য – Qwen3-235B এখনও আরও পরীক্ষিত বিকল্প বলে মনে হচ্ছে, কারণ এটি গংকা নেটওয়ার্কে দীর্ঘ সময় ধরে কাজ করছে। উৎপাদনে একটি ভাল কৌশল হল আপনার কোডে উভয় মডেল রাখা: model প্যারামিটারের মাধ্যমে দ্রুত পরিবর্তন অ্যাপ্লিকেশন আর্কিটেকচার পরিবর্তন না করে কাজের উপর নির্ভর করে তাদের মধ্যে স্যুইচ করার অনুমতি দেয়।

DevShards: গংকা কীভাবে দ্বিতীয় মডেলটি চালু করেছে

2026 সালের বসন্তের আগে, পুরো গংকা নেটওয়ার্ক শুধুমাত্র একটি মডেল পরিবেশন করত — Qwen3-235B। স্থাপত্যের দৃষ্টিকোণ থেকে, এটি একটি যুক্তিযুক্ত সিদ্ধান্ত ছিল: ডিস্ট্রিবিউটেড ইনফারেন্স DiLoCo এর মাধ্যমে প্রয়োজন যে নেটওয়ার্কের সমস্ত অংশগ্রহণকারী একই মডেলকে ভিডিও মেমরিতে রাখবে, অন্যথায় এটি নিশ্চিত করা অসম্ভব যে কোনও নোড কোনও অনুরোধ প্রক্রিয়া করতে পারবে। FP8 ফরম্যাটে সম্পূর্ণ Qwen3-235B প্রায় 640 GB VRAM দখল করে, যা প্রতিটি MLNode এর জন্য একটি বিশাল প্রতিশ্রুতি।

একটি মাল্টি-মডেল নেটওয়ার্কে স্থানান্তরের জন্য এমন একটি মেকানিজমের প্রয়োজন ছিল যা একাধিক মডেলকে একসাথে ধারণ করতে পারে, কিন্তু প্রতিটি হোস্টকে সেগুলিকে সব চালানোর প্রয়োজন হবে না। এই মেকানিজমটি হল DevShards — নেটওয়ার্কের পৃথক শার্ড, যার প্রতিটি একটি নির্দিষ্ট মডেলে বিশেষজ্ঞ। একটি শার্ডের মধ্যে নোডগুলি একই মডেলে কাজ করে এবং নেটওয়ার্ক রাউটার প্রয়োজনীয় মডেল সহ শার্ডে অনুরোধ পাঠায়।

এই ধারণাটি শূন্য থেকে আসেনি — এটি Gonka Improvement Proposal #800 “Multi-Model PoC” এ আনুষ্ঠানিক করা হয়েছিল, যা 2026 সালের বসন্তে সম্প্রদায়ের ভোটের জন্য উপস্থাপন করা হয়েছিল। প্রস্তাবটি অংশগ্রহণকারীদের এবং নেটওয়ার্কের বৈধকারীদের সমর্থন পেয়েছিল এবং 2026 সালের এপ্রিল-মে মাসে বাস্তবায়িত হয়েছিল। Kimi K2.6 একটি পৃথক DevShard-এ চালু হওয়া প্রথম মডেল হয়ে ওঠে — অর্থাৎ, নতুন পদ্ধতির একটি বাস্তব পরীক্ষামূলক বাস্তবায়ন। যদি অভিজ্ঞতা সফল হয়, তবে তৃতীয়, চতুর্থ এবং তাই—প্রত্যেকটি তার নিজস্ব শার্ডে, তার নিজস্ব হোস্ট সেট সহ, নিজস্ব অর্থনীতি এবং নিজস্ব রোডম্যাপ সহ — চালু করতে কিছুই বাধা দেয় না।

ব্যবহারকারীদের এবং ডেভেলপারদের জন্য এর অর্থ কী:

  • একটি API — একাধিক মডেল। JoinGonka Gateway এর মাধ্যমে এন্ডপয়েন্ট বা কী পরিবর্তন করার প্রয়োজন নেই: অনুরোধের বডিতে অন্য model উল্লেখ করলেই যথেষ্ট। OpenAI-কম্পিটেবল ফরম্যাট সম্পূর্ণভাবে বজায় থাকে।
  • দাম একই। বর্তমানে, নেটওয়ার্কে Kimi K2.6 Qwen3-235B-এর মতো একই হারে চার্জ করা হয় — গেটওয়ের মাধ্যমে 1M টোকেনের জন্য $0.001। ভবিষ্যতে দাম মডেল অনুযায়ী ভিন্ন হতে পারে, কিন্তু শুরুতে একক মূল্য নির্ধারণ ব্যবহারকারীদের মাইগ্রেশন সহজ করার জন্য একটি সচেতন সিদ্ধান্ত।
  • স্থিতিশীলতা শার্ড লোডের উপর নির্ভর করে। প্রাথমিক পর্যায়ে, Kimi শার্ডের হোস্ট সংখ্যা Qwen-এর মূল শার্ডের চেয়ে কম থাকে, তাই অনুরোধের ঘনত্বে মডেল সাময়িকভাবে 429 too many concurrent requests ফেরত দিতে পারে। এটি একটি নতুন মডেলের জন্য একটি স্বাভাবিক পর্যায় — আগ্রহ বৃদ্ধির সাথে সাথে হোস্টরা Kimi শার্ডে সংযুক্ত হবে এবং সীমা বাড়বে।
  • টুল কলিং — উন্নয়নের প্রক্রিয়াধীন। এই লেখার সময়, গংকা নেটওয়ার্কে Kimi K2.6-এর স্বয়ংক্রিয় টুল নির্বাচনের (tool_choice: "auto") সাথে ছোটখাটো সমস্যা পাওয়া যাচ্ছে। গংকা টিম OpenAI স্ট্যান্ডার্ডে আচরণ আনার জন্য কাজ করছে; টুল কলিং সহ উৎপাদন-গুরুত্বপূর্ণ পরিস্থিতিতে, আপাতত Qwen3-235B ব্যবহার করার পরামর্শ দেওয়া হচ্ছে।

গংকা এর মাধ্যমে Kimi K2.6 কীভাবে পরীক্ষা করবেন

সবচেয়ে সরাসরি পথ হল JoinGonka API Gateway এর মাধ্যমে। গেটওয়ে একটি OpenAI-সামঞ্জস্যপূর্ণ API সরবরাহ করে, যার অর্থ: GPT, Claude, বা Qwen এর সাথে কাজ করা একই কোড, অনুরোধের বডিতে model ফিল্ডের মান পরিবর্তন করার পর Kimi এর সাথে কাজ করা শুরু করবে।

curl এর মাধ্যমে একটি ন্যূনতম উদাহরণ:

curl https://gate.joingonka.ai/v1/chat/completions \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "moonshotai/Kimi-K2.6",
    "messages": [
      {"role": "user", "content": "MoE এবং dense মডেলের মধ্যে পার্থক্য ব্যাখ্যা কর"}
    ]
  }'

openai লাইব্রেরি ব্যবহার করে পাইথনের মাধ্যমে একই অনুরোধ:

from openai import OpenAI

client = OpenAI(
    api_key="YOUR_API_KEY",
    base_url="https://gate.joingonka.ai/v1",
)

response = client.chat.completions.create(
    model="moonshotai/Kimi-K2.6",
    messages=[{"role": "user", "content": "হ্যালো, Kimi"}],
)
print(response.choices[0].message.content)

স্ট্রিমিং (Server-Sent Events) — ইন্টারেক্টিভ ইন্টারফেস এবং চ্যাটের জন্য, যেখানে উত্তর জেনারেশন চলাকালীন দেখানো হয়:

stream = client.chat.completions.create(
    model="moonshotai/Kimi-K2.6",
    messages=[{"role": "user", "content": "MoE সম্পর্কে একটি প্রবন্ধ লেখ"}],
    stream=True,
)
for chunk in stream:
    delta = chunk.choices[0].delta.content
    if delta:
        print(delta, end="", flush=True)

Kimi K2.6 এর খরচ Qwen3-235B এর মতো, 1 মিলিয়ন টোকেনের জন্য $0.001। এটি GPT-5.4 এর চেয়ে ~2,500 গুণ সস্তা এবং Claude Sonnet 4.5 এর চেয়ে ~3,000 গুণ সস্তা। JoinGonka Gateway এ নিবন্ধনের মাধ্যমে আপনি নেটওয়ার্কের যেকোনো মডেল পরীক্ষা করার জন্য বিনামূল্যে 10 মিলিয়ন টোকেন পাবেন – যা কয়েক ঘন্টা নিবিড় কাজ বা হাজার হাজার সাধারণ অনুরোধের জন্য যথেষ্ট।

ডেভেলপমেন্ট টুলগুলির সাথে সামঞ্জস্যতা: OpenAI API এর সাথে কাজ করে এমন সবকিছুই গেটওয়ের মাধ্যমে Kimi এর সাথেও কাজ করে। মডেল পর্যায়ে শুধুমাত্র model প্যারামিটার পরিবর্তন করলেই যথেষ্ট:

  • Cursor: কাস্টম মডেল সেটিংসে moonshotai/Kimi-K2.6 উল্লেখ করুন।
  • Claude Code: এনভায়রনমেন্ট ভেরিয়েবল ANTHROPIC_MODEL অথবা ফ্ল্যাগ --model
  • OpenClaw, Cline, Continue.dev: কাস্টম চ্যাট মডেলের কনফিগে মডেলের নাম পরিবর্তন করুন।
  • LangChain, n8n: ক্লায়েন্ট ইনিশিয়ালাইজেশনের model প্যারামিটার।
  • Open WebUI, LibreChat: Gonka কে কাস্টম প্রোভাইডার হিসেবে যুক্ত করার পর মডেলটি ড্রপডাউন তালিকায় দেখা যাবে।

আপনার গেটওয়ে ইনস্ট্যান্সের GET /v1/models এন্ডপয়েন্টে উপলব্ধ মডেলগুলির তালিকা সর্বদা আপ-টু-ডেট থাকে — আপনার অ্যাপ্লিকেশনের UI তে এটি গতিশীলভাবে টানতে এটি সুবিধাজনক, যাতে ব্যবহারকারীরা সম্পূর্ণ তালিকা দেখতে পারেন এবং নিজেরাই মডেল নির্বাচন করতে পারেন।

প্রকাশের সময় /try পৃষ্ঠার ডেমো চ্যাট শুধুমাত্র Qwen3-235B এর সাথে কাজ করে — উইজেটের মাল্টি-মডেল নির্বাচক রোডম্যাপে রয়েছে। এখনই Kimi পরীক্ষা করার জন্য গেটওয়ে API ব্যবহার করুন: বিনামূল্যে 10M টোকেন কয়েক ঘন্টা পরীক্ষার জন্য যথেষ্ট। যদি 429 too many concurrent requests উত্তর আসে — এটি গংকা নেটওয়ার্কের প্রাথমিক বৃদ্ধির পর্যায়ে একটি নতুন মডেলের জন্য একটি স্বাভাবিক পর্যায়। কয়েক সেকেন্ড অপেক্ষা করুন বা কম লোডের সময় পর্যন্ত অপেক্ষা করুন।

গংকা নেটওয়ার্কের জন্য এরপর কী: Kimi এর জন্য DevShards এর সাফল্য অন্যান্য মডেলের জন্য পথ খুলে দেয়। সম্প্রদায়ের আলোচনায় DeepSeek-V3/R1, Llama 4 এবং কোডের জন্য বিশেষায়িত মডেলগুলি উল্লেখ করা হয়েছে। প্রতিটি নতুন মডেল মানে নতুন শার্ড, নতুন হোস্ট, ব্যবহারকারীদের জন্য নতুন সুযোগ এবং GPU প্রদানকারীদের জন্য আয়ের নতুন উৎস। একটি মাল্টি-মডেল আর্কিটেকচার কৌশলগতভাবেও গুরুত্বপূর্ণ: একটি মডেলের সাথে আবদ্ধ একটি নেটওয়ার্ক মৌলিকভাবে ভঙ্গুর (একটি নতুন সংস্করণ প্রকাশ হলে মাইগ্রেশন সংকট), যখন একাধিক মডেলকে একসাথে ধারণ করতে সক্ষম একটি নেটওয়ার্ক নরম এবং ক্রমাগতভাবে বিকশিত হয়।

Kimi K2.6 হল Moonshot AI-এর একটি MoE মডেল যার দীর্ঘ প্রসঙ্গ এবং শক্তিশালী যুক্তির ক্ষমতা রয়েছে। মে 2026-এ DevShards (মডেল প্রতি আলাদা শার্ড) মেকানিজমের মাধ্যমে চালু হওয়ার পর এটি Qwen3-235B এর পরে গংকা নেটওয়ার্কের দ্বিতীয় মডেল হয়ে ওঠে। JoinGonka Gateway এর মাধ্যমে OpenAI-সামঞ্জস্যপূর্ণ API এর মাধ্যমে 1M টোকেনের জন্য $0.001 এ উপলব্ধ – Qwen এর মতো একই মূল্য। API তে মডেল শনাক্তকারী: moonshotai/Kimi-K2.6। প্রাথমিক পর্যায়ে অনুরোধের ঘনত্বে অস্থায়ী 429 সম্ভব; টুল কলিং উন্নয়নের পর্যায়ে রয়েছে।

আরও জানতে চান?

অন্যান্য বিভাগগুলি অন্বেষণ করুন অথবা এখনই GNK উপার্জন শুরু করুন।

গেটওয়ের মাধ্যমে Kimi K2.6 পরীক্ষা করুন →