Sekcje bazy wiedzy ▾
Dla początkujących
Dla inwestorów
- Skąd wartość tokena GNK
- Gonka vs konkurenci: Render, Akash, io.net
- Libermanowie: od biofizyki do zdecentralizowanego AI
- Tokenomika GNK
- Ryzyka i perspektywy Gonka: obiektywna analiza
- Gonka vs Render Network: szczegółowe porównanie
- Gonka vs Akash: wnioskowanie AI vs kontenery
- Gonka vs io.net: inferencja vs rynek GPU
- Gonka vs Bittensor: szczegółowe porównanie dwóch podejść do AI
- Gonka vs Flux: dwa podejścia do użytecznego mining
- Zarządzanie w Gonka: Jak zdecentralizowana sieć jest zarządzana
Techniczne
Analiza
- Gonka — Linux dla ery AI
- Killer Switch: dlaczego decentralizacja AI jest potrzebna
- Paliwo, nie złoto — od cyfrowego złota do paliwa AI
- Proof of Useful Work: pełny przewodnik po użytecznym mining
- Dziura o wartości 112 mld dolarów — ukryte bankructwo Big Tech
- Projekty DePIN 2026: Pełny przegląd i porównanie
Narzędzia
- Cursor + Gonka AI — tani LLM do kodowania
- Claude Code + Gonka AI — LLM dla terminala
- OpenClaw + Gonka AI — dostępne agenty AI
- OpenCode + Gonka AI — bezpłatne AI dla kodu
- Continue.dev + Gonka AI — AI dla VS Code/JetBrains
- Cline + Gonka AI — agent AI w VS Code
- Aider + Gonka AI — programowanie w parach z AI
- LangChain + Gonka AI — aplikacje AI za grosze
- n8n + Gonka AI — automatyzacja z tanim AI
- Open WebUI + Gonka AI — Twój własny ChatGPT
- LibreChat + Gonka AI — open-source ChatGPT
- Hermes Agent + Gonka AI — autonomiczny agent za grosze
- Kilo Code + Gonka AI — agent AI w VS Code
- Roo Code + Gonka AI — autonomiczny agent AI w VS Code
- LlamaIndex + Gonka AI — aplikacje RAG za grosze
- PydanticAI + Gonka — typowane agenty AI za grosze
- Vercel AI SDK + Gonka AI — aplikacje AI w TypeScript za grosze
- TanStack AI + Gonka — aplikacje AI w TypeScript za grosze
- API szybki start — curl, Python, TypeScript
- JoinGonka Gateway — pełny przegląd
- Klucze Zarządzania — SaaS na Gonka
- Najtańsze AI API: porównanie dostawców 2026
- Osiągnięto limit żądań Cursor Pro — rzeczywista analiza i tania alternatywa
- Claude Code tańsza alternatywa — analiza rachunku i przełączenie
- Cline spalił dolary — dlaczego agent pali pieniądze
- OpenClaw zbyt drogi — dlaczego agent pali tokeny i jak zaoszczędzić
- OpenRouter tańsza alternatywa – porównanie z JoinGonka Gateway
Narzędzia
LlamaIndex + Gonka AI — aplikacje RAG za grosze
LlamaIndex — wiodący framework do budowania RAG-aplikacji i agentów AI w Pythonie (jest też wersja LlamaIndex.TS dla TypeScript). Zajmuje się ładowaniem dokumentów, dzieleniem na fragmenty, indeksowaniem, wyszukiwaniem wektorowym i składaniem odpowiedzi — opisujesz dane, a LlamaIndex zamienia je w system pytań i odpowiedzi na dowolnym LLM.
Problem jest jeden — koszt wnioskowania. RAG z natury jest zasobożerny: na każde pytanie do modelu wysyłane jest zapytanie plus kilka znalezionych fragmentów kontekstu, a do indeksowania dużych kolekcji dochodzą osadzenia. W przypadku produkcji to tysiące zapytań dziennie. W OpenAI ($2.50–15 za 1M tokenów) lub Anthropic ($3–15 za 1M) nawet skromny serwis pytań i odpowiedzi zamienia się w dziesiątki tysięcy dolarów miesięcznie.
LlamaIndex natywnie współpracuje z dowolnym endpointem kompatybilnym z OpenAI poprzez klasę OpenAILike. To oznacza, że JoinGonka Gateway łączy się za pomocą kilku linii kodu — bez niestandardowych dostawców i poprawek. Rezultat: ten sam system RAG działa za $0.0005/1M tokenów na wejściu (wyjście ×3) przez zdecentralizowaną sieć Gonka — setki i tysiące razy taniej niż API w chmurze.
Szybki start: połączenie przez OpenAILike
Klucz API JoinGonka: zarejestruj się na gate.joingonka.ai/register — na start dajemy 10M darmowych tokenów — i utwórz klucz jg-xxx w Dashboardzie.
Instalacja:
pip install llama-index llama-index-llms-openai-likeDla dowolnego API kompatybilnego z OpenAI, LlamaIndex udostępnia klasę OpenAILike z pakietu llama_index.llms.openai_like. Minimalny przykład zapytania do Gonka:
from llama_index.llms.openai_like import OpenAILike
llm = OpenAILike(
api_base="https://gate.joingonka.ai/v1",
api_key="jg-twój-klucz",
model="Qwen/Qwen3-235B-A22B-Instruct-2507-FP8",
is_chat_model=True, # Gonka to chat-endpoint
is_function_calling_model=True, # natywne wywołania narzędzi są obsługiwane
context_window=131072, # 128K dla Qwen3-235B
max_tokens=8192, # limit wyjścia przez Gateway (Qwen)
)
response = llm.complete("Wyjaśnij, czym jest RAG, w trzech zdaniach.")
print(response)Ważne o OpenAILike: koniecznie ustaw is_chat_model=True — w przeciwnym razie LlamaIndex przejdzie do endpointu uzupełniania, którego u nas nie ma. is_function_calling_model=True włącza natywne wywołania narzędzi. Ustaw context_window zgodnie z modelem, aby LlamaIndex poprawnie dzielił kontekst.
Przykład: potok RAG z silnikiem zapytań
Klasyczny scenariusz LlamaIndex to indeksowanie dokumentów i wykonywanie zapytań za pomocą query_engine. Globalny LLM jest ustawiany raz poprzez Settings.llm, a następnie cały potok automatycznie używa Gonka.
from llama_index.core import (
VectorStoreIndex,
SimpleDirectoryReader,
Settings,
)
from llama_index.llms.openai_like import OpenAILike
from llama_index.embeddings.huggingface import HuggingFaceEmbedding
# 1. LLM przez Gonka (raz — globalnie)
Settings.llm = OpenAILike(
api_base="https://gate.joingonka.ai/v1",
api_key="jg-twój-klucz",
model="Qwen/Qwen3-235B-A22B-Instruct-2507-FP8",
is_chat_model=True,
context_window=131072,
max_tokens=8192,
)
# 2. Lokalne osadzenia (darmowe, bez OpenAI)
Settings.embed_model = HuggingFaceEmbedding(
model_name="BAAI/bge-small-en-v1.5"
)
# 3. Ładowanie i indeksowanie dokumentów z folderu ./data
documents = SimpleDirectoryReader("data").load_data()
index = VectorStoreIndex.from_documents(documents)
# 4. Zapytanie do bazy wiedzy
query_engine = index.as_query_engine()
response = query_engine.query("O czym jest ten dokument?")
print(response)Krytyczny niuans dotyczący osadzeń: domyślnie VectorStoreIndex używa osadzeń OpenAI (text-embedding-ada-002) — są to oddzielne płatne wywołania do OpenAI, a nie do Gonka. Aby całkowicie odłączyć się od OpenAI, ustaw lokalny model osadzeń poprzez Settings.embed_model (jak w przykładzie powyżej — HuggingFaceEmbedding, pakiet pip install llama-index-embeddings-huggingface). Wtedy generowanie odbywa się przez Gonka, a wektoryzacja — lokalnie i za darmo.
Koszt: jedno zapytanie w potoku RAG (wyszukiwanie + generacja) zużywa ~2–5K tokenów LLM. Przez Gonka to ułamki centa; przez OpenAI/Anthropic — 3–4 rzędy wielkości drożej. W przypadku tysięcy zapytań dziennie różnica zamienia się w dziesiątki tysięcy dolarów oszczędności miesięcznie.
Porównanie kosztów obciążenia RAG
Aplikacja RAG to nie jednorazowy czat, ale stały strumień zapytań: każde pytanie użytkownika pociąga za sobą 2–5 tys. tokenów LLM (samo pytanie plus znalezione fragmenty kontekstu). Obliczmy typowe wolumeny i ich koszt u różnych dostawców. Ceny Gonka przez JoinGonka Gateway: wejście ~$0.0005/1M, wyjście ×3.
| Scenariusz | Tokeny LLM | OpenAI / Anthropic | JoinGonka Gonka |
|---|---|---|---|
| Jedno pytanie do bazy wiedzy | ~4K | $0.01 — $0.06 | ~$0.000005 |
| Chatbot wsparcia (1 tys. zapytań/dzień) | ~4M/dzień | $10 — $60 dziennie | ~$0.005 dziennie |
| Indeksacja + Q&A dla korpusu (1M słów) | ~5M | $12 — $75 | ~$0.006 |
| Usługa produkcyjna, 50 tys. zapytań/mies. | ~200M/mies. | $500 — $3,000 mies. | ~$0.25 mies. |
Na darmowych 10M tokenów można dostroić cały potok RAG, zaindeksować korpus testowy i wykonać tysiące zapytań — i nie wydać ani centa. Na wolumenach produkcyjnych JoinGonka Gateway zamienia RAG z drogiej usługi w pozycję kosztów, którą można w ogóle nie zauważać.
Agenci, wywoływanie narzędzi i wybór modelu
LlamaIndex potrafi nie tylko odpowiadać na podstawie dokumentów, ale także budować agenty z narzędziami. Wszystkie trzy modele Gonka obsługują natywne wywołania narzędzi — agenci wywołują funkcje w sposób ustrukturyzowany, bez parsowania tekstu. Przykład agenta z narzędziem:
import asyncio
from llama_index.core.agent.workflow import FunctionAgent
from llama_index.llms.openai_like import OpenAILike
llm = OpenAILike(
api_base="https://gate.joingonka.ai/v1",
api_key="jg-twój-klucz",
model="Qwen/Qwen3-235B-A22B-Instruct-2507-FP8",
is_chat_model=True,
is_function_calling_model=True,
context_window=131072,
max_tokens=8192,
)
def multiply(a: float, b: float) -> float:
"""Mnoży dwie liczby."""
return a * b
agent = FunctionAgent(
tools=[multiply],
llm=llm,
system_prompt="Jesteś pomocnym asystentem. Do obliczeń używaj narzędzi.",
)
async def main():
result = await agent.run("Ile to 1234 razy 5678?")
print(result)
asyncio.run(main())Wybór modelu (pole model i odpowiednie limity context_window / max_tokens):
Model (model) | Kontekst | Max. wyjście | Kiedy wybrać |
|---|---|---|---|
Qwen/Qwen3-235B-A22B-Instruct-2507-FP8 | 128K | 8192 | Domyślny: RAG, agenty, długie odpowiedzi |
moonshotai/Kimi-K2.6 | 128K | 3072 | Silne rozumowanie i wywoływanie narzędzi |
MiniMaxAI/MiniMax-M2.7 | 128K | 4096 | Alternatywa dla zadań agentowych |
Limit max_tokens przez Gateway — do 8192 dla modelu Qwen3; dla Kimi i MiniMaxa odpowiednio 3072 i 4096. Jeśli max_tokens nie jest ustawiony dla żądania niestrumieniowego, domyślnie zostanie zwrócone do 1500 tokenów — dla odpowiedzi RAG i kroków agenta ustaw wartość jawnie.
TypeScript: dla LlamaIndex.TS istnieje lustrzana ścieżka — klasa OpenAI z pakietu @llamaindex/openai przyjmuje baseURL i apiKey (lub odczytuje zmienne OPENAI_BASE_URL / OPENAI_API_KEY), więc ten sam Gateway łączy się również w stosie Node.js. Jeśli budujesz aplikacje AI również na frameworkach Python, sprawdź również przewodnik po LangChain.
Chcesz wiedzieć więcej?
Zapoznaj się z innymi sekcjami lub zacznij zarabiać GNK już teraz.
Otrzymaj 10M darmowych tokenów →