TanStack AI + Gonka — aplikacje AI w TypeScript za grosze

TanStack AI (@tanstack/ai) to bezpieczny typowo SDK dla TypeScript od zespołu TanStack (autorzy Query, Router, Table). Architektura provider-agnostic: czat strumieniowy, natywny tool calling, agenci, ustrukturyzowane wyjście oraz multimodalność poprzez ujednolicony zestaw adapterów. Gotowe bindowania dla React, Vue, Svelte, Solid i Preact (useChat i inne hooki) oraz headless-klient dla serwera.

Problem jest ten sam, co w każdym frameworku AI — cena inferencji. TanStack AI wspiera „po wyjęciu z pudełka” OpenAI, Anthropic i Gemini, ale bezpośrednie taryfy tych dostawców ($2.50–15 za 1M tokenów) sprawiają, że czaty produkcyjne i agenci stają się drodzy: strumieniowe dialogi i cykle narzędziowe szybko pochłaniają miliony tokenów.

Kluczową cechą TanStack AI jest funkcja openaiCompatible(): najwyższej klasy sposób na podłączenie dowolnego endpointu kompatybilnego z OpenAI. Oznacza to, że JoinGonka Gateway integruje się bez niestandardowych adapterów — podajesz baseURL, klucz oraz listę modeli. Wynik: ten sam bezpieczny typowo czat i agenci, ale za $0.003/1M tokenów poprzez zdecentralizowaną sieć Gonka zamiast $2.50–15 w OpenAI.

Krok 1: Zainstaluj TanStack AI i uzyskaj klucz

Instalacja pakietów (rdzeń + adapter OpenAI, w którym znajduje się openaiCompatible):

# pnpm
pnpm add @tanstack/ai @tanstack/ai-openai

# npm
npm install @tanstack/ai @tanstack/ai-openai

Dla interfejsu czatu w React dodaj klienta i hooki:

pnpm add @tanstack/ai-client @tanstack/ai-react

Klucz API JoinGonka: jeśli jeszcze nie masz — zarejestruj się na gate.joingonka.ai/register, uzyskaj 10M darmowych tokenów i utwórz klucz jg-xxx w Dashboard → API Keys. Jeden klucz i jedno saldo działają zarówno dla formatu OpenAI, jak i Anthropic.

Krok 2: Podłącz Gonka przez openaiCompatible

W TanStack AI niestandardowy provider zgodny z OpenAI jest konfigurowany za pomocą funkcji openaiCompatible(): raz definiujesz baseURL, apiKey oraz listę modeli, a następnie wybierasz model przy każdym wywołaniu. Nasz Gateway obsługuje format Chat Completions, więc pozostawiamy api: 'chat-completions' (jest to wartość domyślna).

import { openaiCompatible } from '@tanstack/ai-openai'

// Provider Gonka — konfiguracja jednorazowa
export const gonka = openaiCompatible({
  name: 'gonka',
  baseURL: 'https://gate.joingonka.ai/v1',
  apiKey: process.env.GONKA_API_KEY!, // jg-twój-klucz
  api: 'chat-completions',
  models: [
    'moonshotai/Kimi-K2.6', // domyślny
    'MiniMaxAI/MiniMax-M2.7',
  ],
})

Streaming czatu na serwerze (na przykład route-handler w dowolnym fullstack-framework lub TanStack Start). Długość odpowiedzi ustawiamy poprzez modelOptions — jest to jedyny punkt dla natywnych parametrów wire (max_tokens, temperature):

import { chat, toServerSentEventsResponse } from '@tanstack/ai'
import { gonka } from './gonka'

export async function POST(request: Request) {
  const { messages } = await request.json()

  const stream = chat({
    adapter: gonka('MiniMaxAI/MiniMax-M2.7'),
    messages,
    modelOptions: { max_tokens: 8192 }, // limit wyjściowy przez Gateway
  })

  return toServerSentEventsResponse(stream)
}

Klient React poprzez hook useChat — streamuje odpowiedzi z serwera do UI:

import { useChat } from '@tanstack/ai-react'

function Chat() {
  const { messages, sendMessage, status } = useChat({ api: '/api/chat' })

  return (
    <div>
      {messages.map((m) => (
        <p key={m.id}><b>{m.role}:</b> {m.content}</p>
      ))}
      <button onClick={() => sendMessage('Czym jest Gonka?')}>
        Zapytaj
      </button>
    </div>
  )
}

Bez serwera: ten sam provider działa w skrypcie lub backendzie bezpośrednio — wywołuj chat() i czytaj stream. Połączenie z Gonka jest identyczne we wszystkich wariantach.

Parametry modeli przez Gateway: kontekst obu modeli wynosi 200K tokenów. Limit max_tokens wynosi 8192 dla wszystkich modeli w sieci. Jeśli max_tokens nie jest określony, domyślna wartość dla non-stream to 1500, więc dla długich odpowiedzi definiuj go jawnie.

Porównanie kosztów

TanStack AI działa równie wygodnie zarówno przez bezpośrednie taryfy OpenAI/Anthropic, jak i przez Gonka — zmienia się tylko baseURL. Jednak cena różni się o rzędy wielkości. Porównajmy typowe obciążenia aplikacji produkcyjnej na TanStack AI:

Scenariusz	Tokenów	OpenAI / Anthropic	JoinGonka Gonka
Pojedyncza odpowiedź czatu (streaming)	~3K	$0.008 — $0.045	$0.000014
Cykl agenta z tool calling	~15K	$0.04 — $0.22	$0.000072
1 000 dialogów dziennie	~3M	$7.50 — $45	$0.014
Miesiąc produkcyjny (~100M)	~100M	$250 — $1 500	$0.48

Podejście provider-agnostic w TanStack AI oznacza, że przełączenie na Gonka to edycja tylko jednej linii (baseURL), a nie przepisywanie kodu. Jednocześnie Twoje bezpieczne typowo narzędzia, ustrukturyzowane wyjście i hooki React pozostają bez zmian. Dla aplikacji z tysiącami użytkowników różnica to dziesiątki tysięcy dolarów miesięcznie.

Cena Gonka: wejście ~$0.003 za 1M tokenów, wyjście ×3. To setki–tysiące razy taniej niż bezpośrednie taryfy OpenAI i Anthropic.

Bezpieczne typowo narzędzia i wybór modelu

Główną zaletą TanStack AI jest jednolity kontrakt toolDefinition(): narzędzie opisuje się raz (wejście/wyjście przez Zod, ArkType, Valibot lub JSON Schema), a implementację podłącza się na serwerze lub kliencie. Kimi K2.6 i MiniMax-M2.7 obsługują natywny tool calling przez Gonka, dzięki czemu agenci działają niezawodnie — bez parsowania odpowiedzi tekstowych.

import { chat, toolDefinition } from '@tanstack/ai'
import { gonka } from './gonka'
import { z } from 'zod'

const getWeather = toolDefinition({
  name: 'getWeather',
  description: 'Sprawdź pogodę w mieście',
  inputSchema: z.object({ city: z.string() }),
  outputSchema: z.object({ tempC: z.number() }),
}).server(async ({ city }) => {
  return { tempC: 21 } // twoje rzeczywiste wywołanie API
})

const stream = chat({
  adapter: gonka('MiniMaxAI/MiniMax-M2.7'),
  messages: [{ role: 'user', content: 'Jaka jest pogoda w Moskwie?' }],
  tools: [getWeather],
  modelOptions: { max_tokens: 8192 },
})

Jaki model wybrać:

moonshotai/Kimi-K2.6 — silny w kodowaniu, rozumowaniu i scenariuszach agentowych. Limit odpowiedzi 8192.
MiniMaxAI/MiniMax-M2.7 — domyślny, balans prędkości i jakości, długi kontekst. Limit odpowiedzi 8192.

Dzięki runtime adapter switching w TanStack AI można trzymać oba modele w jednym providerze i przełączać się między nimi w locie — na przykład ciężkie zadania agentowe na Kimi, szybkie odpowiedzi na MiniMax.

TanStack AI + Gonka = bezpieczne typowo aplikacje AI w TypeScript za grosze. Podłączenie przez openaiCompatible — jedna zmiana baseURL, a czat strumieniowy, agenci i narzędzia działają za $0.003/1M tokenów zamiast $2.50–15 w OpenAI. 10M darmowych tokenów wystarczy na tysiące dialogów.

← Vercel AI SDK + Gonka AI — aplikacje AI w TypeScript za grosze API szybki start — curl, Python, TypeScript →

Chcesz wiedzieć więcej?

Zapoznaj się z innymi sekcjami lub zacznij zarabiać GNK już teraz.

Otrzymaj 10M darmowych tokenów →