TanStack AI + Gonka — Aplicaciones de IA en TypeScript por centavos

TanStack AI (@tanstack/ai) es un SDK con seguridad de tipos para TypeScript del equipo de TanStack (autores de Query, Router, Table). Arquitectura agnóstica al proveedor: chat en streaming, tool calling nativo, agentes, salida estructurada y multimodalidad a través de un único conjunto de adaptadores. Enlaces listos para React, Vue, Svelte, Solid y Preact (useChat y otros hooks) además de un cliente headless para el servidor.

El problema es el mismo que en cualquier framework de IA: el costo de inferencia. TanStack AI admite de forma inmediata OpenAI, Anthropic y Gemini, pero las tarifas directas de estos proveedores ($2.50–15 por 1M de tokens) hacen que el chat y los agentes en producción sean costosos: las conversaciones en streaming y los ciclos de herramientas consumen millones de tokens rápidamente.

Una característica clave de TanStack AI es la función openaiCompatible(): una forma de primera clase de conectar cualquier endpoint compatible con OpenAI. Esto significa que JoinGonka Gateway se integra sin adaptadores personalizados: solo especifique la baseURL, la clave y la lista de modelos. El resultado: el mismo chat y agentes con seguridad de tipos, pero por $0.003/1M de tokens a través de la red descentralizada Gonka en lugar de $2.50–15 en OpenAI.

Paso 1: Instalar TanStack AI y obtener una clave

Instalación de paquetes (núcleo + adaptador OpenAI, que contiene openaiCompatible):

# pnpm
pnpm add @tanstack/ai @tanstack/ai-openai

# npm
npm install @tanstack/ai @tanstack/ai-openai

Para la interfaz de chat en React, añada el cliente y los hooks:

pnpm add @tanstack/ai-client @tanstack/ai-react

Clave API de JoinGonka: si aún no tiene una, regístrese en gate.joingonka.ai/register, obtenga 10M de tokens gratuitos y cree una clave jg-xxx en el Dashboard → API Keys. Una sola clave y un solo saldo funcionan tanto para el formato OpenAI como para el formato Anthropic.

Paso 2: Conecte Gonka a través de openaiCompatible

En TanStack AI, un proveedor personalizado compatible con OpenAI se configura con la función openaiCompatible(): defines una vez el baseURL, apiKey y la lista de modelos, y luego eliges el modelo en cada llamada. Nuestro Gateway utiliza el formato Chat Completions, por lo que dejamos api: 'chat-completions' (este es el valor predeterminado).

import { openaiCompatible } from '@tanstack/ai-openai'

// Proveedor Gonka — se configura una sola vez
export const gonka = openaiCompatible({
  name: 'gonka',
  baseURL: 'https://gate.joingonka.ai/v1',
  apiKey: process.env.GONKA_API_KEY!, // jg-tu-clave
  api: 'chat-completions',
  models: [
    'moonshotai/Kimi-K2.6', // predeterminado
    'MiniMaxAI/MiniMax-M2.7',
  ],
})

Chat con streaming en el servidor (por ejemplo, un route handler en cualquier fullstack-framework o TanStack Start). Establecemos la longitud de la respuesta mediante modelOptions — este es el único punto para los parámetros nativos wire (max_tokens, temperature):

import { chat, toServerSentEventsResponse } from '@tanstack/ai'
import { gonka } from './gonka'

export async function POST(request: Request) {
  const { messages } = await request.json()

  const stream = chat({
    adapter: gonka('MiniMaxAI/MiniMax-M2.7'),
    messages,
    modelOptions: { max_tokens: 8192 }, // límite de salida a través de Gateway
  })

  return toServerSentEventsResponse(stream)
}

Cliente React a través del hook useChat — transmite respuestas desde el servidor a la UI:

import { useChat } from '@tanstack/ai-react'

function Chat() {
  const { messages, sendMessage, status } = useChat({ api: '/api/chat' })

  return (
    <div>
      {messages.map((m) => (
        <p key={m.id}><b>{m.role}:</b> {m.content}</p>
      ))}
      <button onClick={() => sendMessage('¿Qué es Gonka?')}>
        Preguntar
      </button>
    </div>
  )
}

Sin servidor: el mismo proveedor funciona en un script o backend directamente — llama a chat() y lee el flujo (stream). La conexión a Gonka es igual para todas las variantes.

Parámetros de modelos a través de Gateway: el contexto disponible para ambos modelos es de 200K tokens. El límite max_tokens es 8192 para todos los modelos de la red. Si no se especifica max_tokens, el valor predeterminado para non-stream es 1500, por lo que para respuestas largas debes establecerlo explícitamente.

Comparación de costes

TanStack AI trabaja igual de bien con las tarifas directas de OpenAI/Anthropic y a través de Gonka; solo cambia la baseURL. Sin embargo, el precio varía en órdenes de magnitud. Comparemos las cargas típicas de una aplicación de producción en TanStack AI:

Escenario	Tokens	OpenAI / Anthropic	JoinGonka Gonka
Una respuesta de chat streaming	~3K	$0.008 — $0.045	$0.000014
Ciclo de agente con tool calling	~15K	$0.04 — $0.22	$0.000072
1 000 diálogos al día	~3M	$7.50 — $45	$0.014
Mes de producción (~100M)	~100M	$250 — $1 500	$0.48

El enfoque agnóstico al proveedor de TanStack AI significa que cambiar a Gonka es solo editar una línea (baseURL), no reescribir el código. Mientras tanto, sus herramientas con seguridad de tipos, salida estructurada y hooks de React permanecen sin cambios. Para una aplicación con miles de usuarios, la diferencia es de decenas de miles de dólares al mes.

Precio de Gonka: entrada ~$0.003 por 1M de tokens, salida ×3. Esto es cientos o miles de veces más barato que las tarifas directas de OpenAI y Anthropic.

Herramientas tipadas y selección de modelo

La característica principal de TanStack AI es el contrato único toolDefinition(): la herramienta se describe una vez (entrada/salida a través de Zod, ArkType, Valibot o JSON Schema), y la implementación se vincula en el servidor o cliente. Kimi K2.6 y MiniMax-M2.7 admiten tool calling nativo a través de Gonka, por lo que los agentes funcionan de forma fiable, sin necesidad de analizar respuestas de texto.

import { chat, toolDefinition } from '@tanstack/ai'
import { gonka } from './gonka'
import { z } from 'zod'

const getWeather = toolDefinition({
  name: 'getWeather',
  description: 'Obtener el clima en la ciudad',
  inputSchema: z.object({ city: z.string() }),
  outputSchema: z.object({ tempC: z.number() }),
}).server(async ({ city }) => {
  return { tempC: 21 } // tu llamada API real
})

const stream = chat({
  adapter: gonka('MiniMaxAI/MiniMax-M2.7'),
  messages: [{ role: 'user', content: '¿Qué clima hace en Moscú?' }],
  tools: [getWeather],
  modelOptions: { max_tokens: 8192 },
})

Qué modelo elegir:

moonshotai/Kimi-K2.6 — excelente en programación, razonamiento y escenarios de agentes. Límite de respuesta 8192.
MiniMaxAI/MiniMax-M2.7 — predeterminado, equilibrio entre velocidad y calidad, contexto largo. Límite de respuesta 8192.

Gracias al runtime adapter switching en TanStack AI, puedes mantener ambos modelos en un mismo proveedor y cambiar entre ellos sobre la marcha — por ejemplo, tareas pesadas de agentes en Kimi, respuestas rápidas en MiniMax.

TanStack AI + Gonka = aplicaciones de IA con seguridad de tipos en TypeScript por una fracción del costo. La conexión mediante openaiCompatible implica solo cambiar la baseURL, y el chat en streaming, agentes y tools funcionan por $0.003/1M de tokens en lugar de $2.50–15 en OpenAI. 10M de tokens gratuitos son suficientes para miles de diálogos.

← Vercel AI SDK + Gonka AI — Aplicaciones de IA en TypeScript por centavos API inicio rápido — curl, Python, TypeScript →

¿Quieres saber más?

Explora otras secciones o empieza a ganar GNK ahora mismo.

Obtén 10M de tokens gratis →