Abschnitte der Wissensbasis ▾

Werkzeuge

Tools

Hermes Agent + Gonka AI – Autonomer Agent für ein paar Cent

Hermes Agent ist ein selbstlernender Open-Source-KI-Agent von Nous Research (MIT-Lizenz). Er ist nicht nur ein Chatbot: Er ist ein vollwertiges Terminal-Tool CLI mit Speicher, Fähigkeiten (Skills), Aufgabenplaner und einem Gateway zu Telegram, Discord, Slack und WhatsApp. Der Agent entwickelt Fähigkeiten aus Erfahrungen, sucht in früheren Dialogen und erstellt ein Benutzerprofil über mehrere Sitzungen hinweg. Er läuft sowohl auf einem VPS für 5 $ als auch auf einem GPU-Cluster.

Das Problem von Hermes – dasselbe wie bei jedem Agenten-Tool: der Token-Verbrauch. Der Agent liest Dateien, durchläuft Tool-Calling-Zyklen, komprimiert den Kontext, verwaltet den Speicher – bei aktiver Arbeit können leicht zig Millionen Token verbraucht werden. Bei Anthropic- oder OpenAI-Modellen (3-15 $ pro 1 Mio.) verwandelt sich das in Dutzende und Hunderte von Dollar pro Tag autonomer Arbeit.

Hermes unterstützt standardmäßig jeden Anbieter: Nous Portal, OpenRouter, OpenAI, Anthropic – oder Ihren eigenen Endpunkt. Hier kommt das JoinGonka Gateway ins Spiel: Unser OpenAI-kompatibles Gateway liefert Inferenzen über das dezentrale Gonka-Netzwerk zu Preisen ab 0,0005 $ pro 1 Mio. Token – Hunderte und Tausende Mal günstiger. Hermes wird zu einem wirklich alltäglichen Werkzeug und nicht zu einer teuren Demonstration.

Schritt 1: Hermes installieren und Schlüssel abrufen

Hermes installieren (Linux, macOS, WSL2). Der offizielle Installer zieht selbstständig Python, Node.js, ripgrep und ffmpeg:

# Linux / macOS / WSL2
curl -fsSL https://hermes-agent.nousresearch.com/install.sh | bash

# Windows (PowerShell)
iex (irm https://hermes-agent.nousresearch.com/install.ps1)

Nach der Installation die Shell neu starten und den Start prüfen:

source ~/.bashrc   # oder ~/.zshrc
hermes             # interaktives CLI

JoinGonka API-Schlüssel: Falls noch kein Konto vorhanden ist – registrieren Sie sich auf gate.joingonka.ai/register, erhalten Sie 10 Millionen kostenlose Token und erstellen Sie einen Schlüssel mit dem Präfix jg- im Dashboard. Ein Schlüssel und ein Guthaben funktionieren sofort für alle Modelle.

Schritt 2: Gonka als benutzerdefinierten Anbieter verbinden

Hermes funktioniert mit jedem OpenAI-kompatiblen Endpunkt: Wenn der Server auf /v1/chat/completions antwortet, kann Hermes darauf geleitet werden. Das JoinGonka Gateway ist genau ein solcher Endpunkt. Es gibt zwei Konfigurationsmöglichkeiten.

Methode 1: Einrichtungsassistent (empfohlen). Starten Sie im Terminal außerhalb einer aktiven Sitzung:

hermes model

Wählen Sie in der Liste der Anbieter „Custom endpoint (self-hosted / VLLM / etc.)“ und geben Sie drei Werte ein:

  • API-Basis-URL: https://gate.joingonka.ai/v1
  • API-Schlüssel: jg-Ihr-Schlüssel
  • Modellname: Qwen/Qwen3-235B-A22B-Instruct-2507-FP8

Methode 2: Konfiguration bearbeiten. Hermes speichert Modelleinstellungen in ~/.hermes/config.yaml – das ist die einzige Wahrheit. Fügen Sie den folgenden Abschnitt hinzu:

# ~/.hermes/config.yaml
model:
  provider: custom
  default: Qwen/Qwen3-235B-A22B-Instruct-2507-FP8
  base_url: https://gate.joingonka.ai/v1
  api_key: jg-Ihr-Schlüssel

Prüfen: Starten Sie hermes und tippen Sie „Erstelle Datei hello.py mit Funktion hello world“. Der Agent sollte die Datei erstellen und das Ergebnis anzeigen. Den aktuellen Konfigurationsstatus sehen Sie über hermes config show | grep '^model\.' und hermes status.

Umschalten im laufenden Betrieb: Innerhalb der Sitzung mit dem Befehl /model custom:Qwen/Qwen3-235B-A22B-Instruct-2507-FP8. Und /model custom ohne Namen ruft das Modell vom Endpunkt ab, wenn dort nur eines ist.

Vergleich der Kosten für autonome Sitzungen

Hermes ist ein Agententool mit Gedächtnis und Fähigkeiten. Es antwortet nicht mit einer einzigen Replik: Es liest Dateien, schreibt Code, führt Befehle aus, komprimiert den Kontext, führt lange Hintergrundaufgaben über den Scheduler aus. Jede Aktion ist ein API-Aufruf, und an einem Tag autonomer Arbeit summieren sich Millionen von Token. Vergleichen wir die Kosten typischer Sitzungen:

AufgabeTokenAnthropic ClaudeJoinGonka Gonka
Einmalige Aufgabe mit Tool-Calling~5M$15 — $75$0.005
Hintergrundagent (mehrere Stunden)~20M$60 — $300$0.02
Autonome Feature-Entwicklung~50M$150 — $750$0.05
Ein Tag Arbeit über Gateway (Telegram + Cron)~150M$450 — $2.250$0.15

Mit JoinGonka Gateway kann Hermes rund um die Uhr laufen: nächtliche Berichte, wöchentliche Audits, Hintergrundaufgaben über den Cron-Scheduler – ohne auf die Rechnung zu achten. Bei den Preisen von Anthropic müsste jeder solcher Start manuell kalkuliert werden. 10 Mio. kostenlose Token bei der Registrierung reichen für Dutzende vollständiger Sitzungen.

Modellauswahl und Tool Calling

Über das Gateway stehen dem Benutzer sofort drei Gonka-Modelle zur Verfügung – alle unterstützen natives Tool Calling (OpenAI Function Calling), sodass die Hermes-Fähigkeiten und -Tools zuverlässig funktionieren, ohne das Parsen von Textantworten:

Modellname (für Konfiguration)KontextMax. AntwortWann wählen
Qwen/Qwen3-235B-A22B-Instruct-2507-FP8128K8192Standard – Balance aus Qualität und Geschwindigkeit für Agentenarbeit
moonshotai/Kimi-K2.6128K3072Starker Argumentations- und Coding-Fähigkeit
MiniMaxAI/MiniMax-M2.7128K4096Agenten-Szenarien, lange Tool-Calling-Ketten

Über Token-Limits in Hermes. Im config.yaml ist das Feld context_length das vollständige Kontextfenster (Eingabe + Ausgabe), während max_tokens nur die Obergrenze für die Antwortlänge ist. Beide sollten besser nicht gesetzt werden: Hermes ermittelt die korrekten Werte vom Anbieter selbst. Wenn Sie max_tokens manuell festlegen, halten Sie es innerhalb der Modellgrenzen – für Qwen3-235B beträgt das Maximum über das Gateway 8192. Das Modell kann jederzeit mit dem Befehl hermes model oder direkt in der Sitzung über /model gewechselt werden.

Ähnliche Terminal-Tools in unserer Wissensdatenbank: Claude Code, Cline.

Hermes Agent + Gonka = autonomer KI-Agent von Nous Research für ein paar Cent. Ein Tag Hintergrundarbeit kostet 0,15 $ statt 450-2.250 $ bei Anthropic. Die Einrichtung erfolgt über einen benutzerdefinierten Anbieter mit der Basis-URL unseres Gateways, nativem Tool Calling und drei Modellen zur Auswahl. 10 Mio. kostenlose Token reichen für Dutzende von Sitzungen.

Möchten Sie mehr erfahren?

Erkunden Sie andere Abschnitte oder beginnen Sie jetzt GNK zu verdienen.

10 Millionen kostenlose Token erhalten →