TanStack AI + Gonka — Applicazioni AI in TypeScript a basso costo

TanStack AI (@tanstack/ai) è un SDK type-safe per TypeScript dal team di TanStack (autori di Query, Router, Table). Architettura Provider-agnostic: chat in streaming, tool calling nativo, agenti, output strutturato e multimodalità tramite un unico set di adattatori. Bindings pronti all'uso per React, Vue, Svelte, Solid e Preact (useChat e altri hook) più un client headless per il server.

Il problema è lo stesso di qualsiasi framework AI: il prezzo dell'inferenza. TanStack AI supporta nativamente OpenAI, Anthropic e Gemini, ma le tariffe dirette di questi provider ($2.50–15 per 1M di token) rendono costose le chat e gli agenti in produzione: le sessioni di streaming e i cicli di strumenti consumano rapidamente milioni di token.

La caratteristica chiave di TanStack AI è la funzione openaiCompatible(): un metodo di prim'ordine per connettere qualsiasi endpoint compatibile con OpenAI. Ciò significa che JoinGonka Gateway si integra senza adattatori personalizzati: basta specificare baseURL, chiave ed elenco modelli. Il risultato: la stessa chat type-safe e gli stessi agenti, ma a $0.003/1M di token tramite la rete decentralizzata Gonka invece di $2.50–15 con OpenAI.

Passo 1: Installa TanStack AI e ottieni la chiave

Installazione dei pacchetti (core + adattatore OpenAI, in cui risiede openaiCompatible):

# pnpm
pnpm add @tanstack/ai @tanstack/ai-openai

# npm
npm install @tanstack/ai @tanstack/ai-openai

Per l'interfaccia di chat su React, aggiungi il client e gli hook:

pnpm add @tanstack/ai-client @tanstack/ai-react

Chiave API JoinGonka: se non l'hai ancora, registrati su gate.joingonka.ai/register, ottieni 10 milioni di token gratuiti e crea una chiave jg-xxx in Dashboard → API Keys. Una singola chiave e un singolo saldo funzionano sia per il formato OpenAI che per il formato Anthropic.

Passo 2: Collega Gonka tramite openaiCompatible

In TanStack AI, un provider personalizzato compatibile con OpenAI viene configurato tramite la funzione openaiCompatible(): si impostano una volta baseURL, apiKey e l'elenco dei modelli, quindi si seleziona il modello ad ogni chiamata. Il nostro Gateway parla in formato Chat Completions, quindi manteniamo api: 'chat-completions' (questo è il valore predefinito).

import { openaiCompatible } from '@tanstack/ai-openai'

// Provider Gonka — configurato una volta sola
export const gonka = openaiCompatible({
  name: 'gonka',
  baseURL: 'https://gate.joingonka.ai/v1',
  apiKey: process.env.GONKA_API_KEY!, // jg-la-tua-chiave
  api: 'chat-completions',
  models: [
    'moonshotai/Kimi-K2.6', // default
    'MiniMaxAI/MiniMax-M2.7',
  ],
})

Streaming-chat lato server (ad esempio, un route-handler in qualsiasi fullstack-framework o TanStack Start). Definiamo la lunghezza della risposta tramite modelOptions — questo è l'unico punto per i parametri nativi wire (max_tokens, temperature):

import { chat, toServerSentEventsResponse } from '@tanstack/ai'
import { gonka } from './gonka'

export async function POST(request: Request) {
  const { messages } = await request.json()

  const stream = chat({
    adapter: gonka('MiniMaxAI/MiniMax-M2.7'),
    messages,
    modelOptions: { max_tokens: 8192 }, // limite di output via Gateway
  })

  return toServerSentEventsResponse(stream)
}

React-client tramite hook useChat — trasmette risposte dal server alla UI:

import { useChat } from '@tanstack/ai-react'

function Chat() {
  const { messages, sendMessage, status } = useChat({ api: '/api/chat' })

  return (
    <div>
      {messages.map((m) => (
        <p key={m.id}><b>{m.role}:</b> {m.content}</p>
      ))}
      <button onClick={() => sendMessage('Cosa è Gonka?')}>
        Chiedi
      </button>
    </div>
  )
}

Senza server: lo stesso provider funziona direttamente in uno script o nel backend — basta chiamare chat() e leggere lo stream. La connessione a Gonka è identica per tutte le varianti.

Parametri dei modelli via Gateway: il contesto per entrambi i modelli è di 200K token. Il limite max_tokens è di 8192 per tutti i modelli della rete. Se max_tokens non è specificato, il default per il non-stream è 1500, quindi per risposte lunghe impostalo esplicitamente.

Confronto dei costi

TanStack AI funziona comodamente sia tramite le tariffe dirette di OpenAI/Anthropic che tramite Gonka, cambiando solo la baseURL. Ma il prezzo differisce di ordini di grandezza. Confrontiamo i carichi tipici di un'applicazione TanStack AI in produzione:

Scenario	Token	OpenAI / Anthropic	JoinGonka Gonka
Una risposta chat in streaming	~3K	$0.008 — $0.045	$0.000014
Ciclo agente con tool calling	~15K	$0.04 — $0.22	$0.000072
1 000 chat al giorno	~3M	$7.50 — $45	$0.014
Mese di produzione (~100M)	~100M	$250 — $1 500	$0.48

L'approccio Provider-agnostic di TanStack AI significa che passare a Gonka è una modifica di una sola riga (baseURL), non una riscrittura del codice. Allo stesso tempo, i tuoi strumenti type-safe, l'output strutturato e i React-hook rimangono invariati. Per un'applicazione con migliaia di utenti, la differenza è di decine di migliaia di dollari al mese.

Prezzo di Gonka: ingresso ~$0.003 per 1M di token, uscita ×3. È centinaia-migliaia di volte più economico rispetto alle tariffe dirette di OpenAI e Anthropic.

Strumenti type-safe e selezione del modello

Il punto di forza di TanStack AI è il contratto unificato toolDefinition(): lo strumento viene descritto una volta (input/output tramite Zod, ArkType, Valibot o JSON Schema), e l'implementazione è collegata sul server o sul client. Kimi K2.6 e MiniMax-M2.7 supportano il tool calling nativo tramite Gonka, quindi gli agenti lavorano in modo affidabile — senza dover parsare le risposte testuali.

import { chat, toolDefinition } from '@tanstack/ai'
import { gonka } from './gonka'
import { z } from 'zod'

const getWeather = toolDefinition({
  name: 'getWeather',
  description: 'Scopri il meteo in una città',
  inputSchema: z.object({ city: z.string() }),
  outputSchema: z.object({ tempC: z.number() }),
}).server(async ({ city }) => {
  return { tempC: 21 } // la tua chiamata API reale
})

const stream = chat({
  adapter: gonka('MiniMaxAI/MiniMax-M2.7'),
  messages: [{ role: 'user', content: 'Che tempo fa a Mosca?' }],
  tools: [getWeather],
  modelOptions: { max_tokens: 8192 },
})

Quale modello scegliere:

moonshotai/Kimi-K2.6 — forte nel coding, nel ragionamento e negli scenari agentivi. Limite di risposta 8192.
MiniMaxAI/MiniMax-M2.7 — default, equilibrio tra velocità e qualità, contesto lungo. Limite di risposta 8192.

Grazie al runtime adapter switching in TanStack AI, è possibile mantenere entrambi i modelli nello stesso provider e passare dall'uno all'altro al volo — ad esempio, compiti agentivi pesanti su Kimi, risposte veloci su MiniMax.

TanStack AI + Gonka = applicazioni AI type-safe su TypeScript a costi minimi. Connessione tramite openaiCompatible: una modifica alla baseURL e chat in streaming, agenti e tools funzionano a $0.003/1M di token invece di $2.50–15 con OpenAI. 10M di token gratuiti bastano per migliaia di conversazioni.

← Vercel AI SDK + Gonka AI — Applicazioni AI in TypeScript a basso costo Avvio rapido API — curl, Python, TypeScript →

Vuoi saperne di più?

Esplora altre sezioni o inizia a guadagnare GNK subito.

Ottieni 10M token gratuiti →