Abschnitte der Wissensbasis ▾
Für Anfänger
Für Investoren
- Woher kommt der Wert des GNK-Tokens
- Gonka vs. Konkurrenten: Render, Akash, io.net
- Die Libermans: von der Biophysik zur dezentralen KI
- GNK Tokenomics
- Risiken und Perspektiven von Gonka: Objektive Analyse
- Gonka vs Render Network: detaillierter Vergleich
- Gonka vs Akash: KI-Inferenz vs Container
- Gonka vs io.net: Inferenz vs GPU-Marktplatz
- Gonka vs Bittensor: Ein detaillierter Vergleich zweier AI-Ansätze
- Gonka vs Flux: Zwei Ansätze zum nützlichen Mining
- Governance in Gonka: Wie ein dezentrales Netzwerk verwaltet wird
Technisch
- Gonka Netzwerkarchitektur: Sprint, Transfer Agents, DiLoCo
- Entwickler: Wie man GNK verdient
- Eigenes Hosting: Schritt-für-Schritt-Anleitung
- GPU-Auswahl für Gonka: Hardware-Empfehlungen
- Qwen3-235B: Das Modell, das Gonka mined
- Kimi K2.6: Das zweite Modell des Gonka-Netzwerks
- MiniMax M2.7: das dritte Modell des Gonka-Netzwerks
Analysen
- Goka — Linux für die KI-Ära
- Killer Switch: Warum ist die Dezentralisierung der KI notwendig?
- Treibstoff, kein Gold – vom digitalen Gold zum KI-Treibstoff
- Proof of Useful Work: Der vollständige Leitfaden zum nützlichen Mining
- 112 Mrd. US-Dollar Loch – die versteckte Pleite von Big Tech
- DePIN-Projekte 2026: Umfassender Überblick und Vergleich
Werkzeuge
- Cursor + Gonka AI – günstige LLM zum Codieren
- Claude Code + Gonka AI – LLM für das Terminal
- OpenClaw + Gonka AI – erschwingliche KI-Agenten
- OpenCode + Gonka AI – kostenlose KI für Code
- Continue.dev + Gonka AI – AI für VS Code/JetBrains
- Cline + Gonka AI – KI-Agent in VS Code
- Aider + Gonka AI – Paarprogrammierung mit KI
- LangChain + Gonka AI – KI-Anwendungen für wenige Cent
- n8n + Gonka AI – Automatisierung mit günstiger KI
- Open WebUI + Gonka AI – Ihr eigenes ChatGPT
- LibreChat + Gonka AI — Open-Source ChatGPT
- Hermes Agent + Gonka AI – Autonomer Agent für ein paar Cent
- Kilo Code + Gonka AI – KI-Agent in VS Code
- Roo Code + Gonka AI – Autonomer KI-Agent in VS Code
- LlamaIndex + Gonka AI – RAG-Anwendungen für kleines Geld
- PydanticAI + Gonka – typisierte KI-Agenten für kleines Geld
- Vercel AI SDK + Gonka AI – KI-Anwendungen mit TypeScript für kleines Geld
- TanStack AI + Gonka – KI-Anwendungen mit TypeScript für kleines Geld
- API Schnellstart — curl, Python, TypeScript
- JoinGonka Gateway — vollständige Übersicht
- Management Keys – SaaS auf Gonka
- Die günstigste AI API: Anbietervergleich 2026
- Cursor Pro Request Limit erreicht – echte Aufschlüsselung und günstige Alternative
- Claude Code günstigere Alternative – Aufschlüsselung der Rechnung und Wechsel
- Cline hat Dollars verbrannt – warum der Agent Geld verbrennt
- OpenClaw zu teuer – warum Agent Token verbrennt und wie man spart
- OpenRouter günstigere Alternative – Vergleich vs JoinGonka Gateway
Werkzeuge
LlamaIndex + Gonka AI – RAG-Anwendungen für kleines Geld
LlamaIndex ist das führende Framework für die Erstellung von RAG-Anwendungen und KI-Agenten in Python (es gibt auch eine TypeScript-Version LlamaIndex.TS). Es übernimmt das Laden von Dokumenten, das Aufteilen in Chunks, die Indizierung, die Vektorsuche und die Zusammenstellung der Antwort – Sie beschreiben die Daten, und LlamaIndex wandelt sie in ein Frage-Antwort-System über jeder LLM um.
Das Problem ist nur eines – die Kosten der Inferenz. RAG ist von Natur aus ressourcenhungrig: Für jede Frage wird eine Anfrage plus mehrere gefundene Kontextfragmente an das Modell gesendet, und für die Indizierung großer Sammlungen kommen Embeddings hinzu. Bei Produktionsmengen sind das Tausende von Anfragen pro Tag. Bei OpenAI (2,50–15 $ pro 1 Mio. Token) oder Anthropic (3–15 $ pro 1 Mio.) wird selbst ein bescheidener Frage-Antwort-Dienst schnell zu Zehntausenden von Dollar pro Monat.
LlamaIndex arbeitet nativ mit jedem OpenAI-kompatiblen Endpunkt über die Klasse OpenAILike zusammen. Das bedeutet, dass JoinGonka Gateway mit wenigen Zeilen Code verbunden werden kann – ohne benutzerdefinierte Anbieter und Patches. Das Ergebnis: Das gleiche RAG-System arbeitet für 0,0005 $/1 Mio. Token für die Eingabe (Ausgabe ×3) über das dezentrale Gonka-Netzwerk – Hundert- bis Tausendmal billiger als Cloud-APIs.
Schnellstart: Verbindung über OpenAILike
JoinGonka API-Schlüssel: Registrieren Sie sich unter gate.joingonka.ai/register – wir geben Ihnen 10 Mio. kostenlose Token zum Start – und erstellen Sie einen Schlüssel jg-xxx im Dashboard.
Installation:
pip install llama-index llama-index-llms-openai-likeFür eine beliebige OpenAI-kompatible API stellt LlamaIndex die Klasse OpenAILike aus dem Paket llama_index.llms.openai_like bereit. Ein minimales Beispiel für eine Anfrage an Gonka:
from llama_index.llms.openai_like import OpenAILike
llm = OpenAILike(
api_base="https://gate.joingonka.ai/v1",
api_key="jg-Ihr-Schlüssel",
model="Qwen/Qwen3-235B-A22B-Instruct-2507-FP8",
is_chat_model=True, # Gonka ist ein Chat-Endpunkt
is_function_calling_model=True, # native Tool-Aufrufe werden unterstützt
context_window=131072, # 128K bei Qwen3-235B
max_tokens=8192, # Ausgabeschwellenwert über Gateway (Qwen)
)
response = llm.complete("Erklären Sie, was RAG in drei Sätzen ist.")
print(response)Wichtig zu OpenAILike: Geben Sie unbedingt is_chat_model=True an – andernfalls geht LlamaIndex zum Completion-Endpunkt, den wir nicht haben. is_function_calling_model=True aktiviert native Tool-Aufrufe. Stellen Sie context_window entsprechend dem Modell ein, damit LlamaIndex den Kontext korrekt aufteilt.
Beispiel: RAG-Pipeline mit Query Engine
Ein klassisches LlamaIndex-Szenario ist ein Index für Ihre Dokumente und Abfragen, die über query_engine an diesen Index gesendet werden. Die globale LLM wird einmal über Settings.llm festgelegt, danach verwendet die gesamte Pipeline automatisch Gonka.
from llama_index.core import (
VectorStoreIndex,
SimpleDirectoryReader,
Settings,
)
from llama_index.llms.openai_like import OpenAILike
from llama_index.embeddings.huggingface import HuggingFaceEmbedding
# 1. LLM über Gonka (einmal – global)
Settings.llm = OpenAILike(
api_base="https://gate.joingonka.ai/v1",
api_key="jg-Ihr-Schlüssel",
model="Qwen/Qwen3-235B-A22B-Instruct-2507-FP8",
is_chat_model=True,
context_window=131072,
max_tokens=8192,
)
# 2. Lokale Embeddings (kostenlos, ohne OpenAI)
Settings.embed_model = HuggingFaceEmbedding(
model_name="BAAI/bge-small-en-v1.5"
)
# 3. Laden und Indizieren von Dokumenten aus dem Ordner ./data
documents = SimpleDirectoryReader("data").load_data()
index = VectorStoreIndex.from_documents(documents)
# 4. Abfrage der Wissensdatenbank
query_engine = index.as_query_engine()
response = query_engine.query("Worum geht es in diesem Dokument?")
print(response)Kritischer Hinweis zu Embeddings: Standardmäßig verwendet VectorStoreIndex OpenAI-Embeddings (text-embedding-ada-002) – dies sind separate kostenpflichtige Aufrufe an OpenAI und nicht an Gonka. Um OpenAI vollständig zu vermeiden, legen Sie ein lokales Embeddings-Modell über Settings.embed_model fest (wie im obigen Beispiel – HuggingFaceEmbedding, Paket pip install llama-index-embeddings-huggingface). Dann erfolgt die Generierung über Gonka und die Vektorisierung lokal und kostenlos.
Kosten: Eine Anfrage an die RAG-Pipeline (Suche + Generierung) verbraucht ~2–5K LLM-Token. Über Gonka sind das Bruchteile von Cents; über OpenAI/Anthropic – 3–4 Größenordnungen teurer. Bei täglich Tausenden von Anfragen wird der Unterschied zu Zehntausenden von Dollar Einsparungen pro Monat.
Kostenvergleich der RAG-Last
Eine RAG-Anwendung ist kein einmaliger Chat, sondern ein ständiger Strom von Anfragen: Jede Benutzerfrage zieht 2–5K LLM-Token nach sich (die Frage selbst plus gefundene Kontextfragmente). Berechnen wir typische Volumina und deren Kosten bei verschiedenen Anbietern. Gonka-Preise über JoinGonka Gateway: Eingabe ~0,0005 $/1 Mio., Ausgabe ×3.
| Szenario | LLM-Token | OpenAI / Anthropic | JoinGonka Gonka |
|---|---|---|---|
| Eine Frage an die Wissensdatenbank | ~4K | 0,01 $ – 0,06 $ | ~0,000005 $ |
| Support-Chatbot (1K Anfragen/Tag) | ~4 Mio./Tag | 10 $ – 60 $ pro Tag | ~0,005 $ pro Tag |
| Indizierung + Q&A für Korpus (1 Mio. Wörter) | ~5 Mio. | 12 $ – 75 $ | ~0,006 $ |
| Produktionsdienst, 50K Anfragen/Monat | ~200 Mio./Monat | 500 $ – 3.000 $ pro Monat | ~0,25 $ pro Monat |
Mit den 10 Mio. kostenlosen Token können Sie die gesamte RAG-Pipeline debuggen, einen Testkorpus indizieren und Tausende von Anfragen ausführen – ohne einen Cent auszugeben. Bei Produktionsvolumen verwandelt JoinGonka Gateway RAG von einem teuren Dienstposten in einen Ausgabenposten, der überhaupt nicht auffällt.
Agenten, Tool-Aufruf und Modellauswahl
LlamaIndex kann nicht nur Dokumente beantworten, sondern auch Agenten mit Tools erstellen. Alle drei Gonka-Modelle unterstützen native Tool-Aufrufe – Agenten rufen Funktionen strukturiert auf, ohne Text zu parsen. Beispiel eines Agenten mit einem Tool:
import asyncio
from llama_index.core.agent.workflow import FunctionAgent
from llama_index.llms.openai_like import OpenAILike
llm = OpenAILike(
api_base="https://gate.joingonka.ai/v1",
api_key="jg-Ihr-Schlüssel",
model="Qwen/Qwen3-235B-A22B-Instruct-2507-FP8",
is_chat_model=True,
is_function_calling_model=True,
context_window=131072,
max_tokens=8192,
)
def multiply(a: float, b: float) -> float:
"""Multipliziert zwei Zahlen."""
return a * b
agent = FunctionAgent(
tools=[multiply],
llm=llm,
system_prompt="Du bist ein hilfreicher Assistent. Verwende Tools für Berechnungen.",
)
async def main():
result = await agent.run("Was ist 1234 multipliziert mit 5678?")
print(result)
asyncio.run(main())Modellwahl (Feld model und entsprechende Grenzwerte context_window / max_tokens):
Modell (model) | Kontext | Max. Ausgabe | Wann zu verwenden |
|---|---|---|---|
Qwen/Qwen3-235B-A22B-Instruct-2507-FP8 | 128K | 8192 | Standard: RAG, Agenten, lange Antworten |
moonshotai/Kimi-K2.6 | 128K | 3072 | Starke Argumentation und Tool-Aufrufe |
MiniMaxAI/MiniMax-M2.7 | 128K | 4096 | Alternative für Agentenaufgaben |
Das Limit von max_tokens über das Gateway beträgt bis zu 8192 für das Qwen3-Modell; für Kimi und MiniMax geben Sie 3072 bzw. 4096 an. Wenn max_tokens für eine Nicht-Streaming-Anfrage nicht angegeben ist, werden standardmäßig bis zu 1500 Token zurückgegeben – legen Sie den Wert für RAG-Antworten und Agentenschritte explizit fest.
TypeScript: Für LlamaIndex.TS gibt es einen spiegelbildlichen Pfad – die Klasse OpenAI aus dem Paket @llamaindex/openai akzeptiert baseURL und apiKey (oder liest die Variablen OPENAI_BASE_URL / OPENAI_API_KEY), sodass dasselbe Gateway auch im Node.js-Stack angeschlossen werden kann. Wenn Sie KI-Anwendungen auch auf Python-Frameworks erstellen, sehen Sie sich auch den Leitfaden zu LangChain an.
Möchten Sie mehr erfahren?
Erkunden Sie andere Abschnitte oder beginnen Sie jetzt GNK zu verdienen.
10 Mio. kostenlose Token erhalten →