Розділи бази знань ▾

Технології

Вибір GPU для Gonka: рекомендації щодо обладнання

Головне питання технічного майнера: який GPU потрібен для Gonka? Розберемо мінімальні вимоги, оптимальні конфігурації та де орендувати сервери, якщо свого обладнання немає.

Мінімальні вимоги

Gonka вимагає NVIDIA GPU з підтримкою CUDA та мінімум 40GB VRAM на MLNode. Це жорстке апаратне обмеження: модель Qwen3-235B з архітектурою MoE (22 млрд активних параметрів з 235 млрд загальних) вимагає значного обсягу відеопам'яті для завантаження ваг та виконання inference. AMD та Intel GPU не підтримуються — Gonka використовує CUDA-стек NVIDIA, включаючи cuBLAS для матричних операцій та cuDNN для нейромережевих шарів.

Повний список вимог:

  • GPU: NVIDIA з CUDA, мінімум 40GB VRAM. Карти з меншим обсягом (RTX 4090 з 24GB, RTX 3090 з 24GB) не підходять — вони фізично не можуть завантажити шарди моделі
  • CPU: обов'язкова підтримка інструкцій AVX — без них inferenced не запуститься (SIGILL при старті)
  • RAM: рекомендується 64GB+ оперативної пам'яті для комфортної роботи, завантаження ваг та обслуговування черг запитів
  • Диск: NVMe SSD з достатнім простором — повний набір ваг Qwen3-235B займає ~640GB, і швидке завантаження з NVMe критичне для часу холодного старту ноди
  • Інтернет: мінімум 100 Мбіт/с стабільного зв'язку — нода отримує запити від Transfer Agents та відправляє результати клієнтам у реальному часі
  • Аптайм: 24/7 — пропуск епох знижує винагороду, а тривалий даунтайм може призвести до виключення з пула завдань

Рекомендовані картки

Розберемо кожну рекомендовану карту детально:

NVIDIA H100 80GB — флагман поточного покоління та оптимальний вибір для Gonka. TDP (тепловий пакет) 700 Вт, вартість ~$25—35K за карту. Підтримує FP8 inference, що прискорює обробку запитів без втрати якості. NVLink дозволяє об'єднати кілька H100 в кластер з високошвидкісним зв'язком між картами. Для повного кластера Qwen3-235B необхідно 8 карт H100 (8 x 80GB = 640GB сумарного VRAM). Це найбільш поширена конфігурація в мережі Gonka.

NVIDIA H200 141GB — наступне покоління з майже вдвічі більшим обсягом пам’яті. Збільшений VRAM дозволяє обробляти більше запитів одночасно (більший batch size), що підвищує дохід у GNK за одиницю часу. Пропускна здатність пам'яті HBM3e вища, ніж у H100 — швидше завантаження ваг, швидше inference. Для кластера Qwen3-235B достатньо 5 карт H200 замість 8 H100, що спрощує інфраструктуру.

NVIDIA A100 40/80GB — попереднє покоління, але все ще підтримується мережею. Ціна ~$10—15K за карту — істотно дешевше H100. Продуктивність нижча: немає FP8, повільніше HBM2e. Версія 40GB — мінімально допустима для Gonka, версія 80GB краща. A100 підходить для входу в мережу з меншими початковими інвестиціями.

Що не підходить: споживчі карти RTX 4090 (24GB), RTX 3090 (24GB), RTX 4080 (16GB) — недостатньо VRAM для роботи з Qwen3-235B. Навіть найпотужніша споживча карта не дотягує до мінімального порога в 40GB. Для повного кластера (640GB VRAM) знадобиться 8 карт H100, 5 карт H200 або 8—16 карт A100 80GB, залежно від конфігурації.

Конфігурація ноди

MLNode у мережі Gonka — це сервер з GPU, який виконує AI inference. Налаштування ноди включає кілька етапів, кожен з яких критичний для стабільної роботи та максимального заробітку GNK.

Програмне забезпечення: основний компонент — inferenced CLI, який керує завантаженням моделі, обробкою запитів та зв'язком з блокчейном. Inferenced працює всередині Docker-контейнера, що спрощує розгортання та оновлення. Для повної конфігурації Qwen3-235B потрібно 640GB сумарного VRAM — наприклад, 8 карт H100 по 80GB кожна. Ваги моделі (~640GB) завантажуються з NVMe SSD при старті ноди.

Реєстрація: після встановлення нода реєструється on-chain — створює запис у блокчейні Gonka із зазначенням своєї адреси, підтримуваних моделей та характеристик (VRAM, пропускна здатність, місцезнаходження). З цього моменту Transfer Agents починають направляти на ноду AI-запити від користувачів.

Робота в мережі: кожен вхідний запит — промпт від користувача — обробляється GPU через нейромережу. Результат відправляється назад через Transfer Agent клієнту. Консенсус Sprint враховує кожне виконане обчислення при формуванні блоку, і нагорода розподіляється пропорційно обсягу роботи. Нода може публікувати оновлені характеристики в реальному часі — якщо завантаження зростає, Transfer Agents перенаправлять частину запитів на менш завантажені ноди. Детальна інструкція з налаштування — у гайді з майнінгу.

Де орендувати GPU

Якщо свого обладнання немає — є три шляхи отримати доступ до GPU для Gonka, кожен з різним балансом вартості, складності та контролю:

ШляхВартістьСкладністьКонтроль
Пулвід $100МінімальнаНизький
Виділений сервервід $12,000/місНизькаСередній
Bare-metal орендавід $2—3/год GPUВисокаПовний

Пули (від $100): Gonka.Top, GonkaPool.ai, Hashiro, Mingles CloudMine — оператори орендують GPU, налаштовують ноди, слідкують за аптаймом. Ви отримуєте GNK пропорційно вкладу, не торкаючись технічних деталей. Ідеальний шлях для новачків та пасивних інвесторів.

Виділені сервери (від $12,000/міс): Gonka.Top пропонує не тільки пули, а й виділені сервери з повним обслуговуванням. Ви отримуєте готову ноду — оператор займається налаштуванням inferenced, моніторингом 24/7, оновленнями та усуненням неполадок. Майнінг йде безпосередньо на ваш гаманець — весь дохід у GNK ваш, за вирахуванням фіксованої орендної плати.

Bare-metal оренда: Spheron надає bare-metal сервери з H100/H200, які ви налаштовуєте самостійно. Це шлях для технічних користувачів, знайомих з Linux, Docker та CLI. Максимальний контроль, але й максимальна відповідальність за налаштування, аптайм та оновлення. Детальне порівняння всіх провайдерів — на сторінці «Отримати GNK».

Для Gonka потрібен NVIDIA GPU з 40GB+ VRAM та CUDA. Оптимальні карти: H100, H200, A100. Повний кластер для Qwen3-235B — 640GB VRAM. Немає свого заліза — орендуйте у Gonka.Top або Spheron, або почніть з пулу.

Бажаєте дізнатися більше?

Вивчіть інші розділи або почніть заробляти GNK прямо зараз.

Порівняти провайдерів та орендувати →