Secciones de la base de conocimientos ▾
Para principiantes
Para inversores
- De dónde proviene el valor del token GNK
- Gonka vs Competidores: Render, Akash, io.net
- Los Liberman: de la biofísica a la IA descentralizada
- Tokenomics de GNK
- Riesgos y perspectivas de Gonka: análisis objetivo
- Gonka vs Render Network: comparación detallada
- Gonka vs Akash: inferencia de IA vs contenedores
- Gonka vs io.net: inferencia vs marketplace de GPU
- Gonka vs Bittensor: Una Comparación Detallada de Dos Enfoques para la IA
- Gonka vs Flux: Dos Enfoques para la Minería Útil
- Gobernanza en Gonka: cómo se gestiona una red descentralizada
Técnico
- Arquitectura de red de Gonka: Sprint, Agentes de Transferencia, DiLoCo
- Desarrolladores: Cómo ganar GNK
- Autoalojamiento: Guía paso a paso
- Elección de GPU para Gonka: recomendaciones de hardware
- Qwen3-235B: el modelo que mina Gonka
- Kimi K2.6: el segundo modelo de la red Gonka
- MiniMax M2.7: la tercera modelo de la red Gonka
Análisis
- Gonka — Linux para la era de la IA
- Interruptor Asesino: por qué se necesita IA descentralizada
- Combustible, no oro: del oro digital al combustible de IA
- Prueba de Trabajo Útil: Una Guía Completa para la Minería Útil
- Agujero de $112 mil millones: la bancarrota oculta de las Grandes Tecnológicas
- Proyectos DePIN 2026: revisión completa y comparación
Herramientas
- Cursor + Gonka AI — LLM barato para codificación
- Claude Code + Gonka AI — LLM para terminal
- OpenClaw + Gonka AI — Agentes de IA accesibles
- OpenCode + Gonka AI — IA gratuita para código
- Continue.dev + Gonka AI — AI para VS Code/JetBrains
- Cline + Gonka AI — Agente de IA en VS Code
- Aider + Gonka AI — Programación en pareja con IA
- LangChain + Gonka AI — Aplicaciones de IA por centavos
- n8n + Gonka AI — Automatización con IA barata
- Open WebUI + Gonka AI — Su propio ChatGPT
- LibreChat + Gonka AI — ChatGPT de código abierto
- Agente Hermes + Gonka AI — agente autónomo por céntimos
- Kilo Code + Gonka AI — agente de IA en VS Code
- Roo Code + Gonka AI — agente de IA autónomo en VS Code
- LlamaIndex + Gonka AI — Aplicaciones RAG por centavos
- PydanticAI + Gonka — Agentes de IA tipados por centavos
- Vercel AI SDK + Gonka AI — Aplicaciones de IA en TypeScript por centavos
- TanStack AI + Gonka — Aplicaciones de IA en TypeScript por centavos
- API inicio rápido — curl, Python, TypeScript
- JoinGonka Gateway — Resumen completo
- Management Keys — SaaS en Gonka
- La API de IA más barata: comparación de proveedores 2026
- Límite de solicitudes de Cursor Pro alcanzado: desglose real y alternativa barata
- Alternativa más barata a Claude Code: desglose de la factura y cambio
- Cline quemó dólares: por qué el agente quema dinero
- OpenClaw demasiado caro: por qué el agente consume tokens y cómo ahorrar
- Alternativa más barata a OpenRouter — comparación con JoinGonka Gateway
Herramientas
LlamaIndex + Gonka AI — Aplicaciones RAG por centavos
LlamaIndex es el framework líder para construir aplicaciones RAG y agentes de IA en Python (también hay una versión TypeScript de LlamaIndex.TS). Se encarga de la carga de documentos, la división en chunks, la indexación, la búsqueda por vectores y el ensamblaje de la respuesta: usted describe los datos y LlamaIndex los convierte en un sistema de preguntas y respuestas sobre cualquier LLM.
El problema es el mismo: el costo de la inferencia. RAG es, por naturaleza, glotón: para cada pregunta, la petición y varios fragmentos de contexto encontrados viajan al modelo, y para indexar grandes colecciones se añaden embeddings. En volúmenes de producción, esto significa miles de peticiones al día. Con OpenAI ($2.50–15 por 1M tokens) o Anthropic ($3–15 por 1M), incluso un servicio modesto de preguntas y respuestas se convierte en decenas de miles de dólares al mes.
LlamaIndex funciona de forma nativa con cualquier endpoint compatible con OpenAI a través de la clase OpenAILike. Esto significa que JoinGonka Gateway se conecta con unas pocas líneas de código, sin proveedores personalizados ni parches. El resultado: el mismo sistema RAG funciona por $0.0005/1M tokens de entrada (salida ×3) a través de la red descentralizada Gonka, miles de veces más barato que las API en la nube.
Inicio rápido: conexión a través de OpenAILike
Clave API de JoinGonka: regístrese en gate.joingonka.ai/register — al inicio le damos 10M de tokens gratuitos — y cree una clave jg-xxx en el Dashboard.
Instalación:
pip install llama-index llama-index-llms-openai-likePara cualquier API compatible con OpenAI, LlamaIndex proporciona la clase OpenAILike del paquete llama_index.llms.openai_like. Un ejemplo mínimo de consulta a Gonka:
from llama_index.llms.openai_like import OpenAILike
llm = OpenAILike(
api_base="https://gate.joingonka.ai/v1",
api_key="jg-tu-clave",
model="Qwen/Qwen3-235B-A22B-Instruct-2507-FP8",
is_chat_model=True, # Gonka es un chat-endpoint
is_function_calling_model=True, # se admite el tool calling nativo
context_window=131072, # 128K para Qwen3-235B
max_tokens=8192, # límite de salida a través de Gateway (Qwen)
)
response = llm.complete("Explica qué es RAG en tres frases.")
print(response)Importante sobre OpenAILike: asegúrese de especificar is_chat_model=True, de lo contrario LlamaIndex irá a un endpoint de finalización que no tenemos. is_function_calling_model=True habilita las llamadas a herramientas nativas. Establezca context_window según el modelo para que LlamaIndex corte el contexto correctamente.
Ejemplo: Pipeline RAG con motor de consulta
Un escenario clásico de LlamaIndex es un índice sobre sus documentos y consultas a él a través de query_engine. La LLM global se establece una vez a través de Settings.llm, después todo el pipeline utiliza Gonka automáticamente.
from llama_index.core import (
VectorStoreIndex,
SimpleDirectoryReader,
Settings,
)
from llama_index.llms.openai_like import OpenAILike
from llama_index.embeddings.huggingface import HuggingFaceEmbedding
# 1. LLM a través de Gonka (una vez - globalmente)
Settings.llm = OpenAILike(
api_base="https://gate.joingonka.ai/v1",
api_key="jg-tu-clave",
model="Qwen/Qwen3-235B-A22B-Instruct-2507-FP8",
is_chat_model=True,
context_window=131072,
max_tokens=8192,
)
# 2. Embeddings locales (gratis, sin OpenAI)
Settings.embed_model = HuggingFaceEmbedding(
model_name="BAAI/bge-small-en-v1.5"
)
# 3. Carga e indexación de documentos de la carpeta ./data
documents = SimpleDirectoryReader("data").load_data()
index = VectorStoreIndex.from_documents(documents)
# 4. Consulta a la base de conocimientos
query_engine = index.as_query_engine()
response = query_engine.query("¿De qué trata este documento?")
print(response)Matiz crítico sobre los embeddings: por defecto, VectorStoreIndex utiliza embeddings de OpenAI (text-embedding-ada-002), lo que implica llamadas pagadas separadas a OpenAI, no a Gonka. Para prescindir por completo de OpenAI, especifique un modelo de embeddings local a través de Settings.embed_model (como en el ejemplo anterior, HuggingFaceEmbedding, paquete pip install llama-index-embeddings-huggingface). Entonces, la generación se realizará a través de Gonka y la vectorización localmente y de forma gratuita.
Coste: una única consulta a un pipeline RAG (búsqueda + generación) consume ~2–5K tokens de LLM. A través de Gonka, esto son fracciones de céntimo; a través de OpenAI/Anthropic, es 3–4 órdenes de magnitud más caro. Con un flujo de miles de consultas al día, la diferencia se traduce en decenas de miles de dólares de ahorro al mes.
Comparación de costes de carga de trabajo RAG
Una aplicación RAG no es un chat de una sola vez, sino un flujo constante de solicitudes: cada pregunta del usuario consume 2-5K tokens de LLM (la pregunta en sí más los fragmentos de contexto encontrados). Calculemos los volúmenes típicos y cuánto cuestan con diferentes proveedores. Precios de Gonka a través de JoinGonka Gateway: entrada ~$0.0005/1M, salida ×3.
| Escenario | Tokens LLM | OpenAI / Anthropic | JoinGonka Gonka |
|---|---|---|---|
| Una pregunta a la base de conocimientos | ~4K | $0.01 — $0.06 | ~$0.000005 |
| Chatbot de soporte (1K solicitudes/día) | ~4M/día | $10 — $60 al día | ~$0.005 al día |
| Indexación + Q&A de un corpus (1M palabras) | ~5M | $12 — $75 | ~$0.006 |
| Servicio de producción, 50K solicitudes/mes | ~200M/mes | $500 — $3,000 al mes | ~$0.25 al mes |
Con 10M de tokens gratuitos, puedes depurar todo el pipeline RAG, indexar un corpus de prueba y ejecutar miles de consultas, sin gastar un céntimo. En volúmenes de producción, JoinGonka Gateway transforma RAG de un servicio costoso en una partida de gastos que ni siquiera se nota.
Agencia, llamada a herramientas y selección de modelo
LlamaIndex no solo puede responder a partir de documentos, sino también construir agentes con herramientas. Los tres modelos de Gonka admiten llamadas a herramientas nativas: los agentes invocan funciones de forma estructurada, sin analizar texto. Ejemplo de un agente con una herramienta:
import asyncio
from llama_index.core.agent.workflow import FunctionAgent
from llama_index.llms.openai_like import OpenAILike
llm = OpenAILike(
api_base="https://gate.joingonka.ai/v1",
api_key="jg-tu-clave",
model="Qwen/Qwen3-235B-A22B-Instruct-2507-FP8",
is_chat_model=True,
is_function_calling_model=True,
context_window=131072,
max_tokens=8192,
)
def multiply(a: float, b: float) -> float:
"""Multiplica dos números."""
return a * b
agent = FunctionAgent(
tools=[multiply],
llm=llm,
system_prompt="Eres un asistente útil. Utiliza las herramientas para los cálculos.",
)
async def main():
result = await agent.run("¿Cuánto es 1234 multiplicado por 5678?")
print(result)
asyncio.run(main())Selección del modelo (campo model y los límites correspondientes context_window / max_tokens):
Modelo (model) | Contexto | Salida máxima | Cuándo usar |
|---|---|---|---|
Qwen/Qwen3-235B-A22B-Instruct-2507-FP8 | 128K | 8192 | Por defecto: RAG, agentes, respuestas largas |
moonshotai/Kimi-K2.6 | 128K | 3072 | Razonamiento fuerte y tool calling |
MiniMaxAI/MiniMax-M2.7 | 128K | 4096 | Alternativa para tareas de agente |
El límite de max_tokens a través de Gateway es de hasta 8192 en el modelo Qwen3; para Kimi y MiniMax, especifique 3072 y 4096 respectivamente. Si max_tokens no se especifica para una solicitud no-streaming, por defecto se devolverá hasta 1500 tokens; para respuestas RAG y pasos de agente, especifíquelo explícitamente.
TypeScript: para LlamaIndex.TS existe un camino espejo: la clase OpenAI del paquete @llamaindex/openai acepta baseURL y apiKey (o lee las variables OPENAI_BASE_URL / OPENAI_API_KEY), por lo que el mismo Gateway se conecta también en el stack de Node.js. Si construye aplicaciones de IA también en frameworks de Python, consulte también la guía de LangChain.
¿Quieres saber más?
Explora otras secciones o empieza a ganar GNK ahora mismo.
Obtener 10M de tokens gratuitos →