أقسام قاعدة المعرفة ▾

أدوات

تقنية

MiniMax M2.7: النموذج الثالث لشبكة Gonka

في ربيع عام 2026، تحولت شبكة Gonka من نموذج واحد إلى متعدد النماذج. أولاً، تمت إضافة Kimi K2.6 إلى النموذج الرائد Qwen3-235B، وفي نهاية مايو 2026 – النموذج الثالث، MiniMax M2.7 من مختبر MiniMax الصيني. هذه هي المرة الأولى في تاريخ الشبكة التي تخدم فيها ثلاثة نماذج لغوية كبيرة مستقلة في وقت واحد.

دعنا نحلل ما هو MiniMax M2.7، ومن يقف وراء تطويره، وما هي خصائصه في شبكة Gonka، وكيف يختلف عن النموذجين الحاليين، وكيفية الوصول إليه من خلال API Gateway الخاص بنا باستخدام بروتوكول متوافق مع OpenAI.

ما هو MiniMax M2.7 ومن يقف وراء النموذج

MiniMax M2.7 هو نموذج لغوي كبير (LLM) من شركة MiniMax، ومقرها شنغهاي. تأسست MiniMax في عام 2021 من قبل فريق من الباحثين بقيادة يان جونجي (الذي عمل سابقًا في SenseTime) وسرعان ما أصبحت واحدة من مختبرات الذكاء الاصطناعي الرائدة في الصين. اجتذبت الشركة تمويلًا من Alibaba و Tencent و HongShan – وهي نفس الدائرة من المستثمرين الاستراتيجيين الذين يقفون وراء "نمور الذكاء الاصطناعي الصينيين" الآخرين، بما في ذلك Moonshot AI، مطور Kimi K2.6.

خارج نماذج اللغة النقية، تشتهر MiniMax بمنتجاتها الاستهلاكية: مساعدي الدردشة Talkie و Hailuo، بالإضافة إلى أحد أبرز مولدات الفيديو في الصناعة. ولكن بالنسبة لشبكة Gonka، فإن خط نماذج النصوص من سلسلة M – خلفاء نماذج abab السابقة – هو الأهم.

السمة المعمارية الرئيسية لسلسلة M هي التركيز على آلية الاهتمام الفعال. إذا كانت النماذج الكبيرة المبكرة تستخدم الاهتمام التربيعي الكلاسيكي (تزداد تكلفة الحسابات بما يتناسب مع مربع طول السياق)، فقد كانت MiniMax واحدة من أوائل الشركات التي أصدرت اهتمامًا خطيًا هجينًا للجمهور. وهذا يسمح بمعالجة تسلسلات طويلة جدًا دون زيادة كبيرة في التكلفة الحسابية – وهي سمة تاريخية للمجموعة. مثل Qwen3-235B و Kimi K2.6، تم بناء النموذج على بنية MoE (Mixture of Experts): مئات المليارات من المعلمات "على الورق"، ولكن يتم تنشيط جزء صغير منها فقط لكل طلب، مما يقلل بشكل جذري من تكلفة inferenced.

في شبكة Gonka، يتم تعريف النموذج باسم MiniMaxAI/MiniMax-M2.7 – هذه هي السلسلة التي يجب تمريرها في حقل model في طلب API. الإصدار M2.7 هو أحدث تكرار لسلسلة M في وقت نشر المقال.

خصائص MiniMax M2.7 في شبكة Gonka

من المهم التمييز بين خصائص النموذج نفسه "خارج الصندوق" والخصائص التي يتم نشرها بها في شبكة معينة. عندما يعمل النموذج في شبكة Gonka اللامركزية، يتم تحديد معلمات عمله بواسطة تكوين vLLM-inferenced على جانب مضيفي GPU، وليس فقط بنية النموذج. فيما يلي القيم الفعلية التي يوفرها Gateway الخاص بنا:

  • نافذة السياق: 131,072 رمزًا (حوالي 100,000 كلمة). هذا هو تكوين subnet في شبكة Gonka. تدعم بنية MiniMax نفسها سياقًا أطول بشكل كبير، ولكن السقف العملي في كل لحظة يتم تحديده بواسطة إعداد inferenced على المضيفين.
  • الحد الأقصى للإخراج: 4,096 رمزًا لكل رد. تم قياس هذا الرقم تجريبيًا – بطلب مع إنشاء طويل قسري، والذي وصل إلى الحد الأقصى (finish_reason: length). للمقارنة، في Qwen3-235B، هذا السقف هو 8,192، وفي Kimi K2.6 هو 3,072 رمزًا. هذا ليس حد النموذج نفسه، ولكنه تكوين vLLM-subnet.
  • متطلبات VRAM للمضيف: حوالي 320 جيجابايت VRAM لكل عقدة. هذا هو مطلب نموذجي لنموذج MoE كبير في تكميم FP8 – نفس الـ 320 جيجابايت مطلوبة لـ Qwen3-235B و Kimi K2.6. من الناحية العملية، هذا يعني عدة وحدات معالجة رسوميات من فئة H100/H200، مدمجة في عقدة واحدة.

لا يعتمد سعر inferenced في شبكة Gonka على اختيار النموذج ويتحدد بواسطة معلمات الشبكة: عبر JoinGonka Gateway، يتوفر MiniMax M2.7 بنفس السعر مثل Qwen و Kimi. السعر الموحد هو نتيجة كون الشبكة تعتمد على حساب تكلفة موحد للعمل الحسابي، وليس سعر بائع معين.

MiniMax M2.7، Qwen3-235B و Kimi K2.6 — مقارنة نماذج Gonka الثلاثة

لأول مرة، يتوفر لمستخدم شبكة Gonka خيار بين ثلاثة نماذج رائدة، وجميعها متاحة من خلال واجهة واحدة متوافقة مع OpenAI JoinGonka Gateway. تساعد المقارنة أدناه على فهم ليس "أي منهم أفضل"، بل ما هي المهام التي تم تحسين كل منها لها.

الخاصيةMiniMax M2.7Qwen3-235BKimi K2.6
الشركة المصنعةMiniMax (شنغهاي)Alibaba Cloud (هانغتشو)Moonshot AI (بكين)
الهندسة المعماريةMoE + اهتمام خطيMoE (235B/22B نشط)MoE
السياق في Gonka131,072 رمزًا131,072 رمزًا131,072 رمزًا
الحد الأقصى للإخراج4,096 رمزًا8,192 رمزًا3,072 رمزًا
القوة التاريخيةسياق طويل، اهتمام فعالتعدد اللغات (119 لغة)، استدعاء الأدواتالاستدلال، سياق طويل
معرّف APIMiniMaxAI/MiniMax-M2.7Qwen/Qwen3-235B-A22B-Instruct-2507-FP8moonshotai/Kimi-K2.6
الحالة في الشبكةتم إطلاقها عبر ترقية v0.2.13 (مايو 2026)مستقرة منذ أغسطس 2025تم إطلاقها عبر DevShards (مايو 2026)

ملاحظة مهمة حول المعايير في عام 2026: انخفض الفارق بين أفضل نماذج "الوزن المفتوح" في الاختبارات العلنية إلى بضع نقاط مئوية، وغالبًا ما يكون هذا الفارق ضمن الهامش الإحصائي للأداء الفعلي. للعمل العملي، الأهم ليس المركز المطلق في ترتيب MMLU، بل طبيعة المهمة: طول السياق، تعقيد السلاسل المنطقية، اللغة المطلوبة، توفر استدعاء الأدوات.

التوجيه العملي: لمهام تتضمن مستندات طويلة جدًا ومعالجة كميات كبيرة من النصوص المتدفقة، من المنطقي اختبار MiniMax M2.7 – حيث أن آلية الانتباه الفعالة لسلسلتها مصممة تاريخيًا لمثل هذه السيناريوهات. للعمل متعدد اللغات العالمي واستدعاء الأدوات المستقر في الإنتاج، يعتبر Qwen3-235B خيارًا مجربًا. لمهام الاستدلال التي تتضمن منطقًا معقدًا – Kimi K2.6. أفضل استراتيجية في الإنتاج هي الاحتفاظ بالنماذج الثلاثة في الكود والتبديل بينها بمعلمة model واحدة دون تغيير بنية التطبيق.

كيف أطلقت Gonka النموذج الثالث: الترقية v0.2.13

إضافة MiniMax M2.7 ليست "تحميل ملف إلى الخادم"، بل هي نتيجة لتحديث الشبكة الذي تم من خلال تصويت على السلسلة. تم تضمين دعم النموذج في إصدار البروتوكول v0.2.13، الذي تم اعتماده بالاقتراح رقم 54: تم قبوله في 21 مايو 2026 (حوالي 63% من الأصوات "مع") وتم تفعيله على ارتفاع كتلة محدد. هذه هي نفس آلية الحوكمة التي من خلالها تقبل الشبكة أي تغييرات كبيرة - من الأسعار إلى النماذج الجديدة.

التعددية النموذجية لشبكة لامركزية هي خطوة أساسية. إن الشبكة المرتبطة بنموذج واحد هشة بطبيعتها: فإصدار نسخة جديدة من النموذج يتحول إلى أزمة هجرة، وأي عطل في النموذج الوحيد يؤدي إلى انهيار الخدمة بأكملها. تتطور الشبكة القادرة على استضافة نماذج متعددة في وقت واحد بسلاسة: يتم إضافة نماذج جديدة كممرات إضافية، وتستمر النماذج القديمة في العمل، وتحصل مضيفات GPU على خيار تحديد ما يجب خدمته. من الناحية الفنية، يعيش كل نموذج في جزء خاص به من الشبكة - وقد تم استخدام هذه الآلية نفسها (DevShards) سابقًا لتشغيل Kimi K2.6.

تفصيل منفصل للمراحل المبكرة: قد يكون هناك تأخير بين "ظهور النموذج في قائمة الشبكة" و "فتح النموذج لجميع العملاء". في البداية، كان استدلال MiniMax M2.7 في وضع الوسيط متاحًا فقط للمفاتيح المتميزة ويعطي خطأ للطلبات العادية - وهي مرحلة اختبار طبيعية. بحلول نهاية مايو 2026، تم فتح الوصول العام، وأصبح النموذج متاحًا لجميع عملاء Gateway. للمزيد من التفاصيل حول كيفية عمل الشبكة وسبب تشغيل النماذج بهذه الطريقة، انظر المقال حول هندسة شبكة Gonka.

نفس MiniMax M2.7 عبر OpenRouter تكلف 0.279 دولار / 1.20 دولار لكل مليون، مقابل 0.001 دولار لـ JoinGonka.

كيفية استخدام MiniMax M2.7 عبر JoinGonka Gateway

المسار الأكثر مباشرة هو عبر JoinGonka API Gateway. نظرًا لأن Gateway يوفر واجهة برمجة تطبيقات متوافقة مع OpenAI، فإن نفس الكود الذي يعمل مع GPT أو Claude أو Qwen أو Kimi سيبدأ العمل مع MiniMax بعد تغيير قيمة حقل model.

مثال بسيط باستخدام curl:

curl https://gate.joingonka.ai/v1/chat/completions \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "MiniMaxAI/MiniMax-M2.7",
    "messages": [
      {"role": "user", "content": "اشرح بإيجاز ما هو الاهتمام الخطي"}
    ]
  }'

نفس الطلب في Python عبر مكتبة openai:

from openai import OpenAI

client = OpenAI(
    api_key="YOUR_API_KEY",
    base_url="https://gate.joingonka.ai/v1",
)

response = client.chat.completions.create(
    model="MiniMaxAI/MiniMax-M2.7",
    messages=[{"role": "user", "content": "مرحباً MiniMax"}],
)
print(response.choices[0].message.content)

البث (Server-Sent Events) – للواجهات التفاعلية، حيث يتم عرض الرد أثناء إنشائه:

stream = client.chat.completions.create(
    model="MiniMaxAI/MiniMax-M2.7",
    messages=[{"role": "user", "content": "اكتب مقالًا قصيرًا عن السياق الطويل"}],
    stream=True,
)
for chunk in stream:
    delta = chunk.choices[0].delta.content
    if delta:
        print(delta, end="", flush=True)

عند التسجيل في JoinGonka Gateway، تحصل على 10 ملايين رمز مجاني لاختبار أي من نماذج الشبكة – وهذا يكفي لمقارنة جميع النماذج الثلاثة في مهامك الخاصة.

التوافق مع أدوات التطوير: كل ما يعمل مع OpenAI API يعمل أيضًا مع MiniMax عبر Gateway. يكفي تغيير معلمة model:

قائمة النماذج الحالية دائمًا متاحة في نقطة النهاية GET /v1/models – يمكن سحبها ديناميكيًا من هناك بسهولة لكي تعرض واجهة المستخدم لتطبيقك المجموعة الجديدة. إذا جاء الرد 429 too many concurrent requests – فهذه مرحلة طبيعية لنموذج جديد في مرحلة نمو الشبكة المبكرة: أعد المحاولة بعد بضع ثوانٍ.

متى تختار MiniMax M2.7 - سيناريوهات عملية

يُعد وجود ثلاثة نماذج في شبكة واحدة ذا قيمة لأنه يمكن اختيار أدوات مختلفة لمهام مختلفة دون تغيير المزود أو كود التكامل. فيما يلي سيناريوهات يجب أن تبدأ فيها الاختبار باستخدام MiniMax M2.7.

تحليل المستندات الطويلة. إذا كانت المهمة هي تلخيص العقود، أو تحليل الوثائق التقنية، أو معالجة النصوص القانونية أو المالية الكبيرة، فإن آلية الانتباه الفعالة لسلسلة M مصممة تاريخيًا للحفاظ على سياق طويل دون زيادة حادة في التكلفة. قم بتمرير المستند بالكامل في طلب واحد واطلب من النموذج التعامل مع الحجم الكامل دفعة واحدة، وليس على أجزاء.

RAG والعمل مع قواعد المعرفة. في سيناريوهات الاسترجاع المعززة، حيث يتم خلط عشرات الأجزاء من قاعدة البيانات المتجهة في السياق، تؤثر قدرة النموذج على الحفاظ على العديد من أجزاء النص المتنوعة بشكل مباشر على جودة الاستجابة. هذه هي الميزة الطبيعية للنماذج ذات السياق الطويل.

معالجة النصوص المنقولة والسجلات. النسخ الصوتية للمكالمات، وحوارات الدعم الطويلة، والسجلات المتدفقة – مهام يكون فيها حجم المدخلات كبيرًا، وعادة ما تكون الاستجابة قصيرة. هنا، لا يتداخل سقف الإخراج البالغ 4096 رمزًا: يتم إدخال الكثير، ويتم الحصول على ملخص أو حقائق مستخرجة في الإخراج.

متى يجب اختيار نموذج آخر. إذا كان تطبيقك يتطلب استجابة طويلة جدًا في طلب واحد (مستند كبير مُنشأ، جزء كبير من الكود)، فتذكر سقف الإخراج البالغ 4096 رمزًا — لدى Qwen3-235B ضعف هذا السقف (8192). إذا كان استدعاء الأدوات الأصلي المستقر في الإنتاج يلعب دورًا رئيسيًا — فقد تم اختبار Qwen3-235B لفترة أطول. لمهام التفكير المنطقي المعقدة متعددة الخطوات، يجب مقارنة الاستجابات مع Kimi K2.6. نصيحة عامة: قم بتشغيل نفس المجموعة من طلباتك الفعلية عبر جميع النماذج الثلاثة وقارن النتائج — 10 ملايين رمز مجاني عند التسجيل تكفي لاختبار مقارن كامل.

من الناحية الفنية، التبديل بين النماذج يعني تغيير سطر واحد في حقل model. لذلك، فإن البنية المعمارية الجيدة للتطبيق على شبكة Gonka لا "تختار نموذجًا إلى الأبد"، بل تسمح بتوجيه الطلبات بين Qwen و Kimi و MiniMax اعتمادًا على نوع المهمة — إن الـ inferenced الرخيص يجعل هذا التوجيه مربحًا اقتصاديًا.

MiniMax M2.7 - هو نموذج MoE لمختبر MiniMax في شنغهاي، وأصبح النموذج الثالث لشبكة Gonka بعد Qwen3-235B و Kimi K2.6. تم تضمين الدعم في ترقية البروتوكول v0.2.13 (الاقتراح رقم 54، مايو 2026)؛ وبحلول نهاية مايو، أصبح الوصول العام للـ inferenced مفتوحًا للجميع. في شبكة Gonka، يعمل النموذج مع سياق 131,072 رمزًا وسقف إخراج 4,096 رمزًا على عقدة واحدة بحوالي 320 جيجابايت VRAM. عبر JoinGonka Gateway، يتوفر عبر واجهة برمجة تطبيقات متوافقة مع OpenAI؛ معرف النموذج هو MiniMaxAI/MiniMax-M2.7. تتميز سلسلة M تاريخياً باهتمام فعال وسياق طويل.

تريد معرفة المزيد؟

استكشف الأقسام الأخرى أو ابدأ في كسب GNK الآن.

جرّب MiniMax M2.7 عبر Gateway →