MiniMax M2.7: نموذج شبكة Gonka

في ربيع 2026 تحولت شبكة Gonka من شبكة ذات نموذج واحد إلى شبكة متعددة النماذج. في البداية تم إضافة Kimi K2.6 إلى النموذج الرئيسي Qwen3-235B، وفي نهاية مايو 2026 تمت إضافة MiniMax M2.7 من مختبر MiniMax الصيني. لاحقاً تم إيقاف Qwen3-235B من الشبكة، واليوم تخدم Gonka نموذجين في وقت واحد — Kimi K2.6 و MiniMax M2.7.

سنشرح ماهية MiniMax M2.7، ومن يقف وراء تطويره، وما هي خصائصه تحديداً في شبكة Gonka، وبماذا يختلف عن النموذج الثاني العامل في الشبكة — Kimi K2.6 — وكيفية الوصول إليه عبر API Gateway الخاص بنا باستخدام بروتوكول متوافق مع OpenAI.

ما هو MiniMax M2.7 ومن يقف وراء النموذج

MiniMax M2.7 هو نموذج لغوي كبير (LLM) من شركة MiniMax، ومقرها شنغهاي. تأسست MiniMax في عام 2021 من قبل فريق من الباحثين بقيادة يان جونجي (الذي عمل سابقًا في SenseTime) وسرعان ما أصبحت واحدة من مختبرات الذكاء الاصطناعي الرائدة في الصين. اجتذبت الشركة تمويلًا من Alibaba و Tencent و HongShan – وهي نفس الدائرة من المستثمرين الاستراتيجيين الذين يقفون وراء "نمور الذكاء الاصطناعي الصينيين" الآخرين، بما في ذلك Moonshot AI، مطور Kimi K2.6.

خارج نماذج اللغة النقية، تشتهر MiniMax بمنتجاتها الاستهلاكية: مساعدي الدردشة Talkie و Hailuo، بالإضافة إلى أحد أبرز مولدات الفيديو في الصناعة. ولكن بالنسبة لشبكة Gonka، فإن خط نماذج النصوص من سلسلة M – خلفاء نماذج abab السابقة – هو الأهم.

السمة المعمارية الرئيسية لسلسلة M هي التركيز على آلية الاهتمام الفعال. إذا كانت النماذج الكبيرة المبكرة تستخدم الاهتمام التربيعي الكلاسيكي (تزداد تكلفة الحسابات بما يتناسب مع مربع طول السياق)، فقد كانت MiniMax واحدة من أوائل الشركات التي أصدرت اهتمامًا خطيًا هجينًا للجمهور. وهذا يسمح بمعالجة تسلسلات طويلة جدًا دون زيادة كبيرة في التكلفة الحسابية – وهي سمة تاريخية للمجموعة. مثل Qwen3-235B و Kimi K2.6، تم بناء النموذج على بنية MoE (Mixture of Experts): مئات المليارات من المعلمات "على الورق"، ولكن يتم تنشيط جزء صغير منها فقط لكل طلب، مما يقلل بشكل جذري من تكلفة inferenced.

في شبكة Gonka، يتم تعريف النموذج باسم MiniMaxAI/MiniMax-M2.7 – هذه هي السلسلة التي يجب تمريرها في حقل model في طلب API. الإصدار M2.7 هو أحدث تكرار لسلسلة M في وقت نشر المقال.

خصائص MiniMax M2.7 في شبكة Gonka

من المهم التمييز بين خصائص النموذج «خارج الصندوق» والخصائص التي يتم نشره بها في شبكة معينة. عندما يعمل النموذج في شبكة Gonka اللامركزية، يتم تحديد معايير تشغيله بواسطة تكوين vLLM-inferenced من جانب مستضيفات GPU، وليس فقط بنية النموذج. فيما يلي القيم الفعلية التي يقدمها Gateway الخاص بنا:

نافذة السياق: 200,000 توكن (حوالي 150,000 كلمة). هذا هو تكوين subnet في شبكة Gonka. بنية MiniMax نفسها تدعم سياقاً أطول بكثير، لكن السقف العملي في أي لحظة يتم تحديده بواسطة إعدادات inferenced على المستضيفات.
أقصى إخراج: 8,192 توكن في استجابة واحدة. تم قياس هذا الرقم تجريبياً — من خلال طلب مع توليد طويل قسري اصطدم بالسقف (finish_reason: length). حالياً، هذا السقف هو نفسه لجميع نماذج الشبكة — يصل إلى 8,192 توكن. هذا ليس حد النموذج نفسه، بل تكوين vLLM-subnet.
متطلبات VRAM للمستضيف: حوالي 320 جيجابايت VRAM لكل عقدة. هذا مطلب نموذجي لنموذج MoE كبير في تكميم FP8 — نفس الـ 320 جيجابايت مطلوبة أيضاً لـ Kimi K2.6. عملياً، هذا يعني عدة بطاقات GPU من فئة H100/H200 مجمعة في عقدة واحدة.

سعر inference في شبكة Gonka لا يعتمد على اختيار النموذج ويتم تحديده بواسطة معايير الشبكة: من خلال JoinGonka Gateway يتاح MiniMax M2.7 بنفس السعر مثل Kimi K2.6. السعر الموحد هو نتيجة لكون الشبكة قائمة على حساب تكلفة موحد للعمل الحوسبي، وليس قائمة أسعار بائع معين.

MiniMax M2.7 و Kimi K2.6 — مقارنة نماذج Gonka

لدى مستخدم شبكة Gonka خيار بين نموذجين رائدين، وكلاهما متاح عبر واجهة برمجة تطبيقات متوافقة مع OpenAI وهي JoinGonka Gateway. تساعد المقارنة أدناه في فهم ليس "أيهما أفضل"، بل أي نوع من الملفات الشخصية للمهام تم تحسين كل نموذج لأجله.

الخصائص	MiniMax M2.7	Kimi K2.6
الشركة المصنعة	MiniMax (شنغهاي)	Moonshot AI (بكين)
البنية	MoE +attention خطي	MoE
السياق في Gonka	200,000 توكن	200,000 توكن
أقصى إخراج	8,192 توكن	8,192 توكن
القوة التاريخية	سياق طويل، attention فعال	Reasoning، سياق طويل
معرف API	`MiniMaxAI/MiniMax-M2.7`	`moonshotai/Kimi-K2.6`
الحالة في الشبكة	تم إطلاقه عبر تحديث v0.2.13 (مايو 2026)	تم إطلاقه عبر DevShards (مايو 2026)

ملاحظة هامة حول المعايير (benchmarks) في عام 2026: تقلصت الفجوة بين أفضل نماذج open-weights في الاختبارات العامة إلى نسب مئوية قليلة، وغالباً ما تكون هذه الاختلافات ضمن هامش الخطأ الإحصائي للمعايير نفسها. للعمل العملي، لا تهم المرتبة المطلقة في تصنيف MMLU، بل طبيعة المهمة: طول السياق، تعقيد السلاسل المنطقية، اللغة المطلوبة، ووجود tool calling.

دليل عملي: للمهام التي تتضمن مستندات طويلة جداً والمعالجة المتدفقة لأحجام كبيرة من النصوص، من المنطقي اختبار MiniMax M2.7 — الـ attention الفعال لسلسلته مصمم تاريخياً لمثل هذه السيناريوهات. لمهام الـ reasoning ذات المنطق المعقد والسياق الطويل، يجب مقارنة الاستجابات مع Kimi K2.6. أفضل استراتيجية في الإنتاج (production) هي الاحتفاظ بكلا النموذجين في الكود والتبديل بينهما عبر معامل model واحد دون تغيير بنية التطبيق.

كيف أطلقت Gonka نموذج MiniMax M2.7: ترقية v0.2.13

إن إضافة MiniMax M2.7 ليست "تحميل ملف إلى الخادم"، بل هي نتيجة لترقية الشبكة التي تمت من خلال التصويت on-chain. تم تضمين دعم النموذج في إصدار البروتوكول v0.2.13، الذي تمت الموافقة عليه بموجب الاقتراح proposal #54: تم قبوله في 21 مايو 2026 (حوالي 63% من الأصوات "بـ نعم") وتفعيله عند ارتفاع محدد للكتلة. هذه هي نفس آلية governance التي تتخذ الشبكة من خلالها أي تغييرات مهمة — من الرسوم إلى النماذج الجديدة.

تعد تعددية النماذج للشبكة اللامركزية خطوة جوهرية. الشبكة المرتبطة بنموذج واحد تكون هشة بشكل أساسي: تحول إصدار نموذج جديد إلى أزمة هجرة، وأي فشل في النموذج الوحيد يؤدي إلى انهيار الخدمة بأكملها. الشبكة القادرة على الاحتفاظ بعدة نماذج في وقت واحد تتطور بسلاسة: تتم إضافة نماذج جديدة كـ "مسارات" إضافية، وتستمر النماذج القديمة في العمل، ويحصل الـ GPU-host على خيار ما يجب خدمته. من الناحية الفنية، يعيش كل نموذج في shard الخاص به على الشبكة — نفس هذه الآلية (DevShards) تم استخدامها سابقاً لتشغيل Kimi K2.6.

فارق بسيط في المراحل المبكرة: قد يكون هناك تأخير بين "ظهور النموذج في قائمة الشبكة" و "فتح النموذج لجميع العملاء". في البداية، كان الـ inferenced لنموذج MiniMax M2.7 في وضع broker متاحاً فقط للمفاتيح المميزة وكان يعيد خطأً للطلبات العادية — وهي مرحلة تشغيل طبيعية. بحلول نهاية مايو 2026، تم فتح الوصول العام وأصبح النموذج متاحاً لجميع عملاء Gateway. اقرأ المزيد حول كيفية عمل الشبكة ولماذا يتم تشغيل النماذج بهذه الطريقة في المقالة حول بنية شبكة Gonka.

نفس MiniMax M2.7 عبر OpenRouter يكلف $0.279/$1.20 لكل 1M، مقابل $0.003/$0.009 في JoinGonka.

كيفية استخدام MiniMax M2.7 عبر JoinGonka Gateway

الطريقة الأكثر مباشرة هي من خلال JoinGonka API Gateway. نظرًا لأن البوابة توفر API متوافق مع OpenAI، فإن نفس الكود الذي يعمل مع GPT أو Claude أو Kimi سيبدأ بالعمل مع MiniMax بعد تغيير قيمة الحقل model.

مثال بسيط عبر curl:

curl https://gate.joingonka.ai/v1/chat/completions \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "MiniMaxAI/MiniMax-M2.7",
    "messages": [
      {"role": "user", "content": "اشرح باختصار ما هو linear attention"}
    ]
  }'

نفس الطلب في Python باستخدام مكتبة openai:

from openai import OpenAI

client = OpenAI(
    api_key="YOUR_API_KEY",
    base_url="https://gate.joingonka.ai/v1",
)

response = client.chat.completions.create(
    model="MiniMaxAI/MiniMax-M2.7",
    messages=[{"role": "user", "content": "مرحباً MiniMax"}],
)
print(response.choices[0].message.content)

البث (Server-Sent Events) — للواجهات التفاعلية حيث تظهر الاستجابة أثناء التوليد:

stream = client.chat.completions.create(
    model="MiniMaxAI/MiniMax-M2.7",
    messages=[{"role": "user", "content": "اكتب مقالاً قصيراً عن السياق الطويل (long context)"}],
    stream=True,
)
for chunk in stream:
    delta = chunk.choices[0].delta.content
    if delta:
        print(delta, end="", flush=True)

عند التسجيل في JoinGonka Gateway، تحصل على 10 ملايين توكن مجانية لاختبار أي نماذج في الشبكة — وهذا يكفي للمقارنة بين كلا نموذجي الشبكة في مهامك الخاصة.

التوافق مع أدوات التطوير: كل ما يعمل مع OpenAI API يعمل أيضًا مع MiniMax عبر البوابة. يكفي تغيير معلمة model:

Cursor: في إعدادات Custom Model حدد MiniMaxAI/MiniMax-M2.7
Claude Code, Cline, Continue.dev: اسم النموذج في ملف التهيئة
LangChain, n8n: المعلمة model عند تهيئة العميل

القائمة الحالية للنماذج متاحة دائمًا في endpoint GET /v1/models — من هناك من السهل سحبها ديناميكيًا بحيث تظهر واجهة تطبيقك مجموعة النماذج الأحدث تلقائيًا. إذا وصل في الرد 429 too many concurrent requests — فهذه مرحلة طبيعية لنموذج جديد في مرحلة مبكرة من نمو الشبكة: كرر الطلب بعد بضع ثوانٍ.

متى تختار MiniMax M2.7 - سيناريوهات عملية

وجود نموذجين في شبكة واحدة قيم لأنه يمكنك اختيار أداة مختلفة لمهام مختلفة دون تغيير المزود أو كود التكامل. فيما يلي السيناريوهات التي يكون فيها من المنطقي بدء الاختبار بـ MiniMax M2.7.

تحليل الوثائق الطويلة. إذا كانت المهمة هي تلخيص العقود، أو تحليل الوثائق التقنية، أو معالجة النصوص القانونية أو المالية الكبيرة، فإن آلية attention الفعالة في سلسلة M مصممة تاريخيًا للحفاظ على سياق طويل دون زيادة حادة في التكلفة. أرسل الوثيقة كاملة في طلب واحد واطلب من النموذج العمل مع الحجم الكامل بدلاً من قطع صغيرة.

RAG والعمل مع قواعد المعرفة. في سيناريوهات retrieval-augmented، حيث يتم خلط عشرات الأجزاء من قاعدة بيانات المتجهات في السياق، تؤثر قدرة النموذج على الاحتفاظ بالعديد من أجزاء النص المتنوعة بشكل مباشر على جودة الإجابة. هذه بيئة طبيعية للنماذج ذات السياق الطويل.

معالجة النصوص المحولة والسجلات (Logs). نسخ المكالمات، حوارات الدعم الطويلة، تدفقات السجلات — مهام حيث يكون حجم المدخلات كبيرًا، وعادة ما تكون الاستجابة قصيرة. هنا، سقف المخرجات البالغ 8 192 توكن لا يمثل عائقًا: المدخلات كبيرة كافية، والمخرجات هي ملخص أو حقائق مستخرجة.

متى يجب اختيار نموذج آخر. حاليًا، توفر جميع نماذج الشبكة حتى 8 192 توكن في استجابة واحدة، لذا إذا كان التطبيق يحتاج إلى استجابة طويلة جدًا في طلب واحد (وثيقة كبيرة مولدة، جزء كبير من الكود) — ضع هذا السقف المشترك في الحسبان عند التصميم وقم بتقسيم التوليد إلى أجزاء. بالنسبة للمهام ذات الاستدلال المعقد متعدد الخطوات، يجدر مقارنة الإجابات بـ Kimi K2.6. نصيحة عامة: قم بتشغيل نفس مجموعة طلباتك الحقيقية من خلال كلا النموذجين وقارن النتائج — 10 ملايين توكن مجانية عند التسجيل تكفي لاختبار مقارنة كامل.

من الناحية التقنية، التبديل بين النماذج هو تغيير سطر واحد في حقل model. لذلك، البنية التحتية الجيدة للتطبيق على شبكة Gonka لا "تختار نموذجًا إلى الأبد"، بل تسمح بتوجيه الطلبات بين Kimi K2.6 و MiniMax M2.7 اعتمادًا على نوع المهمة — الـ inference الرخيص يجعل هذا التوجيه مربحًا اقتصاديًا.

MiniMax M2.7 هو نموذج MoE من مختبر MiniMax في شنغهاي، تمت إضافته إلى شبكة Gonka في مايو 2026 جنبًا إلى جنب مع Kimi K2.6 (تمت إضافة الدعم في ترقية البروتوكول v0.2.13، proposal #54)؛ وبحلول نهاية مايو، أصبح الـ inference العام متاحًا للجميع. في شبكة Gonka، يعمل النموذج مع سياق 200 000 توكن وسقف مخرجات 8 192 توكن لكل عقدة بسعة ~320 جيجابايت VRAM. متاح عبر JoinGonka Gateway بـ API متوافق مع OpenAI؛ معرف النموذج هو MiniMaxAI/MiniMax-M2.7. سلسلة M قوية تاريخيًا بفضل الـ attention الفعال والسياق الطويل.

← Kimi K2.6: النموذج الثاني لشبكة Gonka

تريد معرفة المزيد؟

استكشف الأقسام الأخرى أو ابدأ في كسب GNK الآن.

جرّب MiniMax M2.7 عبر Gateway →