ज्ञानकोश अनुभाग ▾

निवेशकों के लिए

उपकरण

उपकरण

टैनस्टैक AI + गोंका - बहुत कम लागत पर टाइपस्क्रिप्ट पर AI-अनुप्रयोग

टैनस्टैक AI (@tanstack/ai) टैनस्टैक टीम (क्वेरी, राउटर, टेबल के लेखक) से टाइपस्क्रिप्ट के लिए एक टाइप-सेफ SDK है। प्रदाता-अज्ञेयवादी वास्तुकला: स्ट्रीमिंग-चैट, मूल टूल कॉलिंग, एजेंट, संरचित आउटपुट और मल्टीमोडलिटी एडेप्टर के एक एकीकृत सेट के माध्यम से। रिएक्ट, वू, स्वेल्टे, सॉलिड और प्रीएक्ट (useChat और अन्य हुक) के लिए तैयार बाइंडिंग प्लस सर्वर के लिए हेडलेस-क्लाइंट।

समस्या वही है जो किसी भी AI-फ्रेमवर्क के साथ है - अनुमान की कीमत। टैनस्टैक AI बॉक्स से बाहर OpenAI, एंथ्रोपिक और जेमिनी का समर्थन करता है, लेकिन इन प्रदाताओं की सीधी दरें ($2.50–15 प्रति 1M टोकन) उत्पादन-चैट और एजेंटों को महंगा बनाती हैं: स्ट्रीमिंग-संवाद और टूल-चक्र जल्दी से लाखों टोकन की खपत करते हैं।

टैनस्टैक AI की मुख्य विशेषता - openaiCompatible() फ़ंक्शन: किसी भी OpenAI-संगत एंडपॉइंट को जोड़ने का एक प्राथमिक तरीका। इसका मतलब है कि जॉइनगोंका गेटवे (JoinGonka Gateway) कस्टम एडेप्टर के बिना एकीकृत होता है - आप baseURL, कुंजी और मॉडलों की सूची निर्दिष्ट करते हैं। परिणाम: वही टाइप-सेफ चैट और एजेंट, लेकिन गोंका (Gonka) के विकेन्द्रीकृत नेटवर्क के माध्यम से 1M टोकन के लिए $0.0005 पर, OpenAI के $2.50–15 के बजाय।

चरण 1: टैनस्टैक AI स्थापित करें और कुंजी प्राप्त करें

पैकेजों की स्थापना (कोर + OpenAI-एडाप्टर, जिसमें openaiCompatible रहता है):

# pnpm
pnpm add @tanstack/ai @tanstack/ai-openai

# npm
npm install @tanstack/ai @tanstack/ai-openai

रिएक्ट पर चैट-इंटरफ़ेस के लिए क्लाइंट और हुक जोड़ें:

pnpm add @tanstack/ai-client @tanstack/ai-react

जॉइनगोंका API कुंजी: यदि अभी तक नहीं है - gate.joingonka.ai/register पर पंजीकरण करें, 10M मुफ्त टोकन प्राप्त करें और डैशबोर्ड → API कुंजियां में jg-xxx कुंजी बनाएं। एक कुंजी और एक शेष राशि OpenAI- और एंथ्रोपिक-फ़ॉर्मेट दोनों के लिए काम करती है।

चरण 2: openaiCompatible के माध्यम से गोंका को कनेक्ट करें

टैनस्टैक AI में, कस्टम OpenAI-संगत प्रदाता को openaiCompatible() फ़ंक्शन द्वारा कॉन्फ़िगर किया जाता है: एक बार baseURL, apiKey और मॉडलों की सूची सेट करें, और फिर प्रत्येक कॉल पर मॉडल चुनें। हमारा गेटवे चैट पूर्णता फ़ॉर्मेट में बात करता है, इसलिए हम api: 'chat-completions' छोड़ देते हैं (यह डिफ़ॉल्ट मान है)।

import { openaiCompatible } from '@tanstack/ai-openai'

// गोंका प्रदाता — एक बार कॉन्फ़िगर किया गया
export const gonka = openaiCompatible({
  name: 'gonka',
  baseURL: 'https://gate.joingonka.ai/v1',
  apiKey: process.env.GONKA_API_KEY!, // jg-आपकी-कुंजी
  api: 'chat-completions',
  models: [
    'Qwen/Qwen3-235B-A22B-Instruct-2507-FP8', // डिफ़ॉल्ट
    'moonshotai/Kimi-K2.6',
    'MiniMaxAI/MiniMax-M2.7',
  ],
})

सर्वर पर स्ट्रीमिंग-चैट (उदाहरण के लिए, किसी भी फुलस्टैक-फ्रेमवर्क में रूट-हैंडलर या टैनस्टैक स्टार्ट)। हम modelOptions के माध्यम से प्रतिक्रिया की लंबाई सेट करते हैं - यह मूल वायर-पैरामीटर्स (max_tokens, temperature) के लिए एकमात्र बिंदु है:

import { chat, toServerSentEventsResponse } from '@tanstack/ai'
import { gonka } from './gonka'

export async function POST(request: Request) {
  const { messages } = await request.json()

  const stream = chat({
    adapter: gonka('Qwen/Qwen3-235B-A22B-Instruct-2507-FP8'),
    messages,
    modelOptions: { max_tokens: 8192 }, // गेटवे के माध्यम से Qwen की सीमा
  })

  return toServerSentEventsResponse(stream)
}

useChat हुक के माध्यम से रिएक्ट-क्लाइंट - UI में सर्वर से प्रतिक्रियाओं को स्ट्रीम करता है:

import { useChat } from '@tanstack/ai-react'

function Chat() {
  const { messages, sendMessage, status } = useChat({ api: '/api/chat' })

  return (
    <div>
      {messages.map((m) => (
        <p key={m.id}><b>{m.role}:</b> {m.content}</p>
      ))}
      <button onClick={() => sendMessage('गोंका क्या है?')}>
        पूछें
      </button>
    </div>
  )
}

बिना सर्वर के: वही प्रदाता स्क्रिप्ट या बैकएंड में सीधे काम करता है - chat() को कॉल करें और स्ट्रीम पढ़ें। सभी विकल्पों के लिए गोंका से कनेक्शन समान है।

गेटवे के माध्यम से मॉडल पैरामीटर्स: सभी तीन मॉडलों का संदर्भ - 128K टोकन। max_tokens की सीमा: Qwen3-235B - 8192, Kimi K2.6 - 3072, MiniMax-M2.7 - 4096। यदि max_tokens निर्दिष्ट नहीं है, तो गैर-स्ट्रीम के लिए डिफ़ॉल्ट - 1500, इसलिए लंबे उत्तरों के लिए इसे स्पष्ट रूप से सेट करें।

लागत की तुलना

TanStack AI OpenAI/Anthropic की सीधी दरों और Gonka के माध्यम से समान रूप से आसानी से काम करता है - केवल baseURL बदलता है। लेकिन कीमत में काफी अंतर है। TanStack AI पर एक उत्पादन एप्लिकेशन के विशिष्ट भार की तुलना करें:

परिदृश्यटोकनOpenAI / AnthropicJoinGonka Gonka
एक स्ट्रीमिंग चैट प्रतिक्रिया~3K$0.008 — $0.045$0.000004
टूल कॉलिंग के साथ एजेंट साइकिल~15K$0.04 — $0.22$0.00002
प्रति दिन 1,000 संवाद~3M$7.50 — $45$0.003
एक महीने का उत्पादन (~100M)~100M$250 — $1,500$0.10

TanStack AI का प्रोवाइडर-अज्ञेयवादी दृष्टिकोण का अर्थ है कि Gonka पर स्विच करना एक लाइन का संपादन (baseURL) है, न कि कोड को फिर से लिखना। साथ ही, आपके टाइप-सेफ उपकरण, संरचित आउटपुट और React-हुक अपरिवर्तित रहते हैं। हजारों उपयोगकर्ताओं वाले एप्लिकेशन के लिए, अंतर प्रति माह हजारों डॉलर का है।

गोंका की कीमत: इनपुट ~$0.0005 प्रति 1M टोकन, आउटपुट ×3। यह OpenAI और Anthropic की सीधी दरों से सैकड़ों-हजारों गुना सस्ता है।

टाइप-सेफ उपकरण और मॉडल चयन

TanStack AI की मुख्य विशेषता एकीकृत toolDefinition() अनुबंध है: एक उपकरण एक बार वर्णित किया जाता है (Zod, ArkType, Valibot या JSON Schema के माध्यम से इनपुट/आउटपुट), और कार्यान्वयन सर्वर या क्लाइंट पर बंधा होता है। Qwen3-235B, Kimi K2.6 और MiniMax-M2.7 Gonka के माध्यम से मूल टूल कॉलिंग का समर्थन करते हैं, इसलिए एजेंट विश्वसनीय रूप से काम करते हैं – टेक्स्ट प्रतिक्रियाओं को पार्स किए बिना।

import { chat, toolDefinition } from '@tanstack/ai'
import { gonka } from './gonka'
import { z } from 'zod'

const getWeather = toolDefinition({
  name: 'getWeather',
  description: 'Узнать погоду в городе',
  inputSchema: z.object({ city: z.string() }),
  outputSchema: z.object({ tempC: z.number() }),
}).server(async ({ city }) => {
  return { tempC: 21 } // आपका वास्तविक API कॉल
})

const stream = chat({
  adapter: gonka('Qwen/Qwen3-235B-A22B-Instruct-2507-FP8'),
  messages: [{ role: 'user', content: 'Какая погода в Москве?' }],
  tools: [getWeather],
  modelOptions: { max_tokens: 8192 },
})

कौन सा मॉडल चुनें:

  • Qwen/Qwen3-235B-A22B-Instruct-2507-FP8 – डिफ़ॉल्ट। सबसे बड़ी प्रतिक्रिया सीमा (8192) और मजबूत टूल कॉलिंग। एजेंटों और संरचित आउटपुट के लिए उपयुक्त।
  • moonshotai/Kimi-K2.6 – लंबी बातचीत और तर्क-वितर्क के लिए उत्कृष्ट। प्रतिक्रिया सीमा 3072।
  • MiniMaxAI/MiniMax-M2.7 – गति और गुणवत्ता का संतुलन, सीमा 4096।

TanStack AI में रनटाइम एडॉप्टर स्विचिंग के कारण, सभी तीन मॉडल एक प्रदाता में रखे जा सकते हैं और तुरंत उनके बीच स्विच किया जा सकता है – उदाहरण के लिए, Qwen पर भारी एजेंट कार्य, MiniMax पर त्वरित प्रतिक्रियाएं।

TanStack AI + Gonka = सस्ते में TypeScript में टाइप-सेफ AI एप्लिकेशन। openaiCompatible के माध्यम से कनेक्शन – एक baseURL सुधार, और स्ट्रीमिंग चैट, एजेंट और टूल OpenAI के $2.50–15 के बजाय $0.0005/1M टोकन पर काम करते हैं। 10M मुफ्त टोकन हजारों संवादों के लिए पर्याप्त होंगे।

अधिक जानना चाहते हैं?

अन्य अनुभागों का अन्वेषण करें या अभी GNK कमाना शुरू करें।

10M मुफ्त टोकन प्राप्त करें →