Hermes Agent + Gonka AI – Autonomer Agent für ein paar Cent

Hermes Agent ist ein selbstlernender Open-Source-KI-Agent von Nous Research (MIT-Lizenz). Dies ist nicht nur ein Chat: ein vollwertiger Terminal-CLI mit Gedächtnis, Fähigkeiten (Skills), Aufgabenplaner und Gateway zu Telegram, Discord, Slack und WhatsApp. Der Agent erstellt Fähigkeiten aus Erfahrungen, durchsucht vergangene Dialoge und baut zwischen den Sitzungen ein Benutzermodell auf. Läuft sowohl auf einem VPS für $5 als auch auf einem GPU-Cluster.

Das Problem bei Hermes ist das gleiche wie bei jedem Agenten-Tool: der Token-Verbrauch. Der Agent liest Dateien, führt Tool-Calling-Schleifen aus, komprimiert den Kontext, verwaltet das Gedächtnis – bei aktiver Arbeit kommen leicht Millionen von Token zusammen. Bei Anthropic- oder OpenAI-Modellen ($3–15 pro 1M) summiert sich das bei autonomer Arbeit auf zweistellige oder dreistellige Dollarbeträge pro Tag.

Hermes unterstützt standardmäßig jeden Anbieter: Nous Portal, OpenRouter, OpenAI, Anthropic — oder Ihren eigenen Endpoint. Genau dies ist der Einstiegspunkt für das JoinGonka Gateway: Unser OpenAI-kompatibles Gateway liefert Inferenz über das dezentrale Gonka-Netzwerk zu einem Preis ab $0.003 pro 1M Token — hunderte bis tausende Male günstiger. Hermes wird so zu einem echten Alltagswerkzeug und nicht nur einer teuren Demo.

Schritt 1: Hermes installieren und Schlüssel abrufen

Hermes installieren (Linux, macOS, WSL2). Der offizielle Installer zieht selbstständig Python, Node.js, ripgrep und ffmpeg:

# Linux / macOS / WSL2
curl -fsSL https://hermes-agent.nousresearch.com/install.sh | bash

# Windows (PowerShell)
iex (irm https://hermes-agent.nousresearch.com/install.ps1)

Nach der Installation die Shell neu starten und den Start prüfen:

source ~/.bashrc   # oder ~/.zshrc
hermes             # interaktives CLI

JoinGonka API-Schlüssel: Falls noch kein Konto vorhanden ist – registrieren Sie sich auf gate.joingonka.ai/register, erhalten Sie 10 Millionen kostenlose Token und erstellen Sie einen Schlüssel mit dem Präfix jg- im Dashboard. Ein Schlüssel und ein Guthaben funktionieren sofort für alle Modelle.

Schritt 2: Gonka als benutzerdefinierten Anbieter verbinden

Hermes arbeitet mit jedem OpenAI-kompatiblen Endpoint: Wenn der Server auf /v1/chat/completions antwortet, kann Hermes dorthin geleitet werden. Das JoinGonka Gateway ist genau ein solcher Server. Es gibt zwei Möglichkeiten der Einrichtung.

Methode 1: Einrichtungsassistent (empfohlen). Führe im Terminal außerhalb einer aktiven Sitzung aus:

hermes model

Wähle in der Liste der Provider „Custom endpoint (self-hosted / VLLM / etc.)“ aus und gib die drei Werte ein:

API base URL: https://gate.joingonka.ai/v1
API key: jg-dein-key
Model name: MiniMaxAI/MiniMax-M2.7

Methode 2: Konfiguration bearbeiten. Hermes speichert Modelleinstellungen in ~/.hermes/config.yaml — dies ist die einzige Quelle der Wahrheit. Füge den folgenden Abschnitt hinzu:

# ~/.hermes/config.yaml
model:
  provider: custom
  default: MiniMaxAI/MiniMax-M2.7
  base_url: https://gate.joingonka.ai/v1
  api_key: jg-dein-key

Überprüfung: Starte hermes und schreibe „Erstelle eine Datei hello.py mit der Funktion hello world“. Der Agent sollte die Datei erstellen und das Ergebnis anzeigen. Den Status der aktuellen Konfiguration siehst du über hermes config show | grep '^model\.' und hermes status.

Umschalten während der Laufzeit: Innerhalb der Sitzung mit dem Befehl /model custom:MiniMaxAI/MiniMax-M2.7. Und /model custom ohne Namen zieht das Modell automatisch vom Endpoint, falls dort nur eines vorhanden ist.

Vergleich der Kosten für autonome Sitzungen

Hermes ist ein Agenten-Tool mit Gedächtnis und Fähigkeiten. Es antwortet nicht nur mit einer einzigen Nachricht: Es liest Dateien, schreibt Code, führt Befehle aus, komprimiert den Kontext und verwaltet lange Hintergrundaufgaben über einen Scheduler. Jede Aktion ist ein API-Aufruf, und bei einem Tag autonomer Arbeit summieren sich die Token auf zig Millionen. Vergleichen wir die Kosten typischer Sitzungen:

Aufgabe	Token	Anthropic Claude	JoinGonka Gonka
Einmalige Aufgabe mit tool-calling	~5M	$15 — $75	$0.024
Hintergrundagent (einige Stunden)	~20M	$60 — $300	$0.096
Autonome Feature-Entwicklung	~50M	$150 — $750	$0.24
24 Stunden Betrieb über Gateway (Telegram + cron)	~150M	$450 — $2,250	$0.72

Mit dem JoinGonka Gateway kann Hermes rund um die Uhr laufen: Nachtberichte, wöchentliche Audits, Hintergrundaufgaben via cron-Scheduler – ohne auf die Kosten zu achten. Zu den Preisen von Anthropic müsste man jeden dieser Durchläufe manuell kalkulieren. Die 10M kostenlosen Token bei der Registrierung reichen für Dutzende vollständiger Sitzungen.

Modellauswahl und Tool Calling

Über das Gateway stehen dem Benutzer sofort zwei Gonka-Modelle zur Verfügung – beide unterstützen natives Tool Calling (OpenAI function calling), daher funktionieren die Fähigkeiten und Tools von Hermes zuverlässig, ohne dass Textantworten analysiert werden müssen:

Model name (für config)	Kontext	Max. Antwort	Wann wählen
`moonshotai/Kimi-K2.6`	200K	8192	Standard – Starkes Reasoning, Coding und Agenten-Szenarien
`MiniMaxAI/MiniMax-M2.7`	200K	8192	Langer Kontext, lange Tool-Calling-Ketten

Zu den Token-Limits in Hermes. Im config.yaml ist das Feld context_length das gesamte Kontextfenster (Eingabe + Ausgabe), während max_tokens nur die Obergrenze für die Antwortlänge darstellt. Es ist am besten, beides nicht zu setzen: Hermes bestimmt die korrekten Werte selbst vom Anbieter. Wenn Sie max_tokens manuell festlegen, halten Sie ihn innerhalb der Modellgrenzen – für beide Modelle beträgt das Maximum über das Gateway 8192. Das Modell kann jederzeit über den Befehl hermes model oder direkt in der Sitzung über /model gewechselt werden.

Ähnliche Terminal-Tools in unserer Wissensdatenbank: Claude Code, Cline.

Hermes Agent + Gonka = autonomer KI-Agent von Nous Research für ein paar Cent. Ein Tag Hintergrundarbeit kostet 0,15 $ statt 450-2.250 $ bei Anthropic. Die Einrichtung erfolgt über einen benutzerdefinierten Anbieter mit der Basis-URL unseres Gateways, nativem Tool Calling und drei Modellen zur Auswahl. 10 Mio. kostenlose Token reichen für Dutzende von Sitzungen.

← LibreChat + Gonka AI — Open-Source ChatGPT Kilo Code + Gonka AI – KI-Agent in VS Code →

Möchten Sie mehr erfahren?

Erkunden Sie andere Abschnitte oder beginnen Sie jetzt GNK zu verdienen.

10 Millionen kostenlose Token erhalten →