知识库章节 ▾
投资者
技术
分析
工具
- Cursor + Gonka AI — 便宜的 LLM 用于编码
- Claude Code + Gonka AI — 终端的 LLM
- OpenClaw + Gonka AI — 可负担的 AI 代理
- OpenCode + Gonka AI — 免费的代码 AI
- Continue.dev + Gonka AI — 适用于 VS Code/JetBrains 的 AI
- Cline + Gonka AI — VS Code 中的 AI 代理
- Aider + Gonka AI — 与 AI 结对编程
- LangChain + Gonka AI — 便宜的 AI 应用程序
- n8n + Gonka AI — 通过便宜的 AI 实现自动化
- Open WebUI + Gonka AI — 您的 ChatGPT
- LibreChat + Gonka AI — 开源 ChatGPT
- Hermes Agent + Gonka AI — 廉价自主代理
- Kilo Code + Gonka AI — VS Code 中的 AI 代理
- Roo Code + Gonka AI — VS Code 中的自主 AI 代理
- LlamaIndex + Gonka AI — 低成本的 RAG 应用程序
- PydanticAI + Gonka — 低成本的类型化 AI 代理
- Vercel AI SDK + Gonka AI — 低成本的 TypeScript AI 应用程序
- TanStack AI + Gonka — 低成本的 TypeScript AI 应用程序
- API 快速入门 — curl, Python, TypeScript
- JoinGonka Gateway - 全面概述
- 管理密钥 — Gonka 上的 SaaS
- 最便宜的AI API:2026年提供商对比
- Cursor Pro 请求限制已达 — 真实分析与廉价替代方案
- Claude Code 更便宜的替代方案 — 账单分析与切换
- Cline 烧钱 — 为什么代理会烧钱
- OpenClaw 太贵 — 为什么代理会烧钱以及如何节省
- OpenRouter 更便宜的替代方案 — 与 JoinGonka Gateway 的比较
工具
Hermes Agent + Gonka AI — 廉价自主代理
Hermes Agent 是 Nous Research 的开源自主学习 AI 代理(MIT 许可证)。它不仅仅是聊天:它是一个功能齐全的终端 CLI,具有记忆、技能、任务规划器和连接到 Telegram、Discord、Slack 和 WhatsApp 的网关。代理根据经验创建技能,在过去的对话中搜索,并在会话之间构建用户模型。它可以在 $5 的 VPS 上运行,也可以在 GPU 集群上运行。
Hermes 的问题与所有代理工具相同:令牌消耗。代理读取文件,运行工具调用循环,压缩上下文,维护内存——一次活跃的操作很容易消耗数千万令牌。在 Anthropic 或 OpenAI 模型(每 1M 令牌 $3-15)上,这会变成每天数十甚至数百美元的自主运行费用。
Hermes 默认支持任何提供商:Nous Portal、OpenRouter、OpenAI、Anthropic——或您自己的端点。这就是 JoinGonka Gateway 的切入点:我们的 OpenAI 兼容网关以每 1M 令牌 $0.0005 的价格提供 Gonka 去中心化网络的推理服务——便宜数百甚至数千倍。Hermes 真正成为日常工具,而不是昂贵的演示。
步骤 1:安装 Hermes 并获取密钥
安装 Hermes (Linux, macOS, WSL2)。官方安装程序将自动安装 Python, Node.js, ripgrep 和 ffmpeg:
# Linux / macOS / WSL2
curl -fsSL https://hermes-agent.nousresearch.com/install.sh | bash
# Windows (PowerShell)
iex (irm https://hermes-agent.nousresearch.com/install.ps1)安装后重新加载 shell 并检查启动:
source ~/.bashrc # 或 ~/.zshrc
hermes # 交互式 CLIJoinGonka API 密钥:如果还没有,请在 gate.joingonka.ai/register 注册,获取 10M 免费令牌并在 Dashboard 中创建前缀为 jg- 的密钥。一个密钥和一个余额可立即用于所有模型。
步骤 2:将 Gonka 连接为自定义提供商
Hermes 支持任何 OpenAI 兼容的端点:如果服务器响应 /v1/chat/completions,Hermes 就可以将其指向那里。JoinGonka Gateway 就是这样的。有两种配置方法。
方法 1:配置向导(推荐)。在终端中非活动会话中运行:
hermes model在提供商列表中选择“Custom endpoint (self-hosted / VLLM / etc.)”并输入三个值:
- API base URL:
https://gate.joingonka.ai/v1 - API key:
jg-您的密钥 - Model name:
Qwen/Qwen3-235B-A22B-Instruct-2507-FP8
方法 2:编辑配置文件。Hermes 将模型设置存储在 ~/.hermes/config.yaml 中——这是唯一的真相来源。添加以下部分:
# ~/.hermes/config.yaml
model:
provider: custom
default: Qwen/Qwen3-235B-A22B-Instruct-2507-FP8
base_url: https://gate.joingonka.ai/v1
api_key: jg-您的密钥验证:启动 hermes 并输入“创建一个名为 hello.py 的文件,其中包含 hello world 函数”。代理应该创建文件并显示结果。通过 hermes config show | grep '^model\.' 和 hermes status 可以查看当前配置的状态。
即时切换:在会话内部,使用命令 /model custom:Qwen/Qwen3-235B-A22B-Instruct-2507-FP8。如果只有一个模型,/model custom 将自动从端点拉取模型。
自主会话成本比较
Hermes 是一个具有记忆和技能的代理工具。它不会只回复一条信息:它读取文件、编写代码、运行命令、压缩上下文、并通过调度程序执行长时间的后台任务。每个操作都是一次 API 调用,并且在一天自主工作中会累积数千万个令牌。让我们比较一下典型会话的成本:
| 任务 | 令牌 | Anthropic Claude | JoinGonka Gonka |
|---|---|---|---|
| 一次性工具调用任务 | ~5M | $15 — $75 | $0.005 |
| 后台代理(数小时) | ~20M | $60 — $300 | $0.02 |
| 自主功能开发 | ~50M | $150 — $750 | $0.05 |
| 通过网关运行一天(Telegram + cron) | ~150M | $450 — $2,250 | $0.15 |
通过 JoinGonka Gateway,Hermes 可以全天候运行:夜间报告、每周审计、通过 cron 调度程序执行后台任务——无需担心费用。以 Anthropic 的价格,每次运行都必须手动计算。注册时免费提供的 10M 令牌足以满足数十次完整的会话。
模型选择和工具调用
通过 Gateway,用户可以立即使用三个 Gonka 模型——所有模型都支持原生工具调用 (OpenAI function calling),因此 Hermes 的技能和工具可以可靠地工作,无需解析文本响应:
| 模型名称 (用于配置) | 上下文 | 最大响应 | 何时选择 |
|---|---|---|---|
Qwen/Qwen3-235B-A22B-Instruct-2507-FP8 | 128K | 8192 | 默认——代理工作的质量和速度平衡 |
moonshotai/Kimi-K2.6 | 128K | 3072 | 强大的推理和编码 |
MiniMaxAI/MiniMax-M2.7 | 128K | 4096 | 代理场景,长链工具调用 |
关于 Hermes 中的令牌限制。 在 config.yaml 中,context_length 字段是完整的上下文窗口(输入 + 输出),而 max_tokens 是响应长度的上限。最好不要设置这两个字段:Hermes 会自动从提供商处确定正确的值。如果您手动设置 max_tokens,请将其保持在模型限制内——对于 Qwen3-235B,通过 Gateway 的最大值为 8192。您可以随时通过 hermes model 命令或直接在会话中通过 /model 更改模型。
知识库中类似终端工具:Claude Code,Cline。