Hermes Agent + Gonka AI — 廉价自主代理

Hermes Agent 是由 Nous Research 开发的具备自学习能力的开源 AI 代理（采用 MIT 许可证）。它不仅仅是一个聊天机器人：这是一个功能完整的终端 CLI，具备记忆、技能、任务规划，并提供连接到 Telegram、Discord、Slack 和 WhatsApp 的网关。代理可以从经验中积累技能、搜索过往对话，并在会话间构建用户模型。它可以运行在任何设备上，从 $5 的 VPS 到 GPU 集群均可。

Hermes 的问题与任何代理工具一样：token 消耗量。代理会读取文件、运行 tool-calling 循环、压缩上下文、维护记忆——在活跃工作状态下，很容易消耗数千万 token。使用 Anthropic 或 OpenAI 模型（每百万 token $3-15）时，这每天可能导致数十甚至数百美元的自动运行开销。

Hermes 默认支持任何提供商：Nous Portal、OpenRouter、OpenAI、Anthropic，或者你自己的端点。这就是 JoinGonka Gateway 的入口所在：我们兼容 OpenAI 的网关能够提供来自去中心化 Gonka 网络的推理服务，价格只要每百万 token $0.003 起 —— 数百甚至数千倍的成本缩减。Hermes 因此能够成为真正的日常工具，而不再是一个昂贵的演示模型。

步骤 1：安装 Hermes 并获取密钥

安装 Hermes (Linux, macOS, WSL2)。官方安装程序将自动安装 Python, Node.js, ripgrep 和 ffmpeg：

# Linux / macOS / WSL2
curl -fsSL https://hermes-agent.nousresearch.com/install.sh | bash

# Windows (PowerShell)
iex (irm https://hermes-agent.nousresearch.com/install.ps1)

安装后重新加载 shell 并检查启动：

source ~/.bashrc   # 或 ~/.zshrc
hermes             # 交互式 CLI

JoinGonka API 密钥：如果还没有，请在 gate.joingonka.ai/register 注册，获取 10M 免费令牌并在 Dashboard 中创建前缀为 jg- 的密钥。一个密钥和一个余额可立即用于所有模型。

步骤 2：将 Gonka 连接为自定义提供商

Hermes 可与任何 OpenAI 兼容的 endpoint 配合使用：只要服务器响应 /v1/chat/completions，Hermes 就可以连接到它。JoinGonka Gateway 完全符合此标准。有两种配置方法。

方法 1：设置向导（推荐）。在终端中非会话模式下运行：

hermes model

在提供商列表中选择 “Custom endpoint (self-hosted / VLLM / etc.)” 并输入以下三个值：

API base URL: https://gate.joingonka.ai/v1
API key: jg-你的密钥
Model name: MiniMaxAI/MiniMax-M2.7

方法 2：修改配置文件。Hermes 将模型设置存储在 ~/.hermes/config.yaml 中，这是唯一的配置源。添加以下部分：

# ~/.hermes/config.yaml
model:
  provider: custom
  default: MiniMaxAI/MiniMax-M2.7
  base_url: https://gate.joingonka.ai/v1
  api_key: jg-你的密钥

验证：运行 hermes 并输入“创建一个包含 hello world 函数的 hello.py 文件”。智能体应创建文件并显示结果。当前配置状态可通过 hermes config show | grep '^model\.' 和 hermes status 查看。

即时切换：在会话内使用命令 /model custom:MiniMaxAI/MiniMax-M2.7。如果 endpoint 中只有一个模型，使用不带名称的 /model custom 命令也会自动拉取该模型。

自主会话成本比较

Hermes 是一款具备记忆和技能的智能体工具。它不仅仅是用单一回复进行应答：它能够阅读文件、编写代码、运行命令、压缩上下文，并通过调度器执行长时间的后台任务。每一个操作都是一次 API 调用，在全天自动运行过程中会积累数千万个 token。让我们比较典型会话的成本：

任务	Token 数	Anthropic Claude	JoinGonka Gonka
带 tool-calling 的单次任务	~5M	$15 — $75	$0.024
后台智能体（数小时）	~20M	$60 — $300	$0.096
自动功能开发	~50M	$150 — $750	$0.24
通过网关全天候运行 (Telegram + cron)	~150M	$450 — $2,250	$0.72

使用 JoinGonka Gateway，Hermes 可以 24/7 全天候运行：夜间报告、每周审计、通过 cron 调度器执行的后台任务——无需担心账单。按照 Anthropic 的价格，每次这样的运行都必须手动计算成本。注册时赠送的 10M 免费 token 足以进行数十次完整的会话。

模型选择和工具调用

通过 Gateway，用户可以立即使用两种 Gonka 模型——两者均支持原生 tool calling（OpenAI function calling），因此 Hermes 的技能和工具可以可靠地工作，无需解析文本回复：

模型名称 (用于 config)	上下文	最大回复	选择建议
`moonshotai/Kimi-K2.6`	200K	8192	默认推荐 — 强大的推理、编码和智能体场景
`MiniMaxAI/MiniMax-M2.7`	200K	8192	长上下文、长链路 tool-calling

关于 Hermes 中的 token 限制。 在 config.yaml 中，context_length 字段是完整上下文窗口（输入 + 输出），而 max_tokens 仅是回复长度的上限。最好都不进行设置：Hermes 会自动从提供者处获取正确的值。如果你手动设置了 max_tokens，请将其保持在模型范围内——通过 Gateway 的两种模型最大值均为 8192。你可以随时使用 hermes model 命令或直接在会话中通过 /model 更改模型。

我们知识库中类似的终端工具包括：Claude Code, Cline。

Hermes Agent + Gonka = 廉价的 Nous Research 自主 AI 代理。一天的后台工作成本为 $0.15，而 Anthropic 则为 $450-2,250。配置方式：自定义提供商，使用我们的网关 base_url，原生工具调用，三种模型可供选择。10M 免费令牌足以满足数十个会话。

← LibreChat + Gonka AI — 开源 ChatGPT Kilo Code + Gonka AI — VS Code 中的 AI 代理 →

想了解更多？

探索其他章节或立即开始赚取 GNK。

获取 10M 免费令牌 →