Hermes Agent + Gonka AI — tác nhân tự động với chi phí thấp

Hermes Agent — AI-agent tự học mã nguồn mở từ Nous Research (Giấy phép MIT). Đây không chỉ là trò chuyện: một CLI terminal đầy đủ với bộ nhớ, skills, bộ lập lịch task và cổng kết nối vào Telegram, Discord, Slack và WhatsApp. Agent tạo ra kỹ năng từ kinh nghiệm, tìm kiếm thông qua các cuộc hội thoại trước đó và xây dựng mô hình người dùng giữa các phiên. Chạy được trên VPS giá $5, hoặc trên GPU-cluster.

Vấn đề của Hermes — cũng giống như bất kỳ công cụ agent nào khác: tiêu thụ token. Agent đọc file, chạy tool-calling loops, nén ngữ cảnh, duy trì bộ nhớ — việc làm việc tích cực dễ dàng tiêu tốn hàng chục triệu token. Với các model của Anthropic hoặc OpenAI ($3-15 cho mỗi 1M), điều này biến thành hàng chục và hàng trăm đô la cho mỗi ngày vận hành tự động.

Hermes mặc định hỗ trợ bất kỳ nhà cung cấp nào: Nous Portal, OpenRouter, OpenAI, Anthropic — hoặc endpoint của riêng bạn. Đây chính là điểm nhập cho JoinGonka Gateway: gateway tương thích OpenAI của chúng tôi cung cấp inferenced từ mạng lưới phi tập trung Gonka với mức giá từ $0.003 cho mỗi 1M token — rẻ hơn hàng trăm và hàng nghìn lần. Hermes trở thành một công cụ thường ngày thực thụ, thay vì một bản trình diễn đắt đỏ.

Bước 1: Cài đặt Hermes và lấy khóa

Cài đặt Hermes (Linux, macOS, WSL2). Trình cài đặt chính thức sẽ tự động tải Python, Node.js, ripgrep và ffmpeg:

# Linux / macOS / WSL2
curl -fsSL https://hermes-agent.nousresearch.com/install.sh | bash

# Windows (PowerShell)
iex (irm https://hermes-agent.nousresearch.com/install.ps1)

Sau khi cài đặt, khởi động lại shell và kiểm tra việc khởi chạy:

source ~/.bashrc # hoặc ~/.zshrc
hermes # CLI tương tác

Khoá API JoinGonka: nếu chưa có — đăng ký tại gate.joingonka.ai/register, nhận 10 triệu token miễn phí và tạo khoá có tiền tố jg- trong Dashboard. Một khoá và một số dư hoạt động ngay lập tức cho tất cả các mô hình.

Bước 2: Kết nối Gonka làm nhà cung cấp tùy chỉnh

Hermes hoạt động với bất kỳ endpoint tương thích OpenAI nào: nếu máy chủ phản hồi tại /v1/chat/completions — Hermes có thể kết nối với nó. Gateway JoinGonka chính xác là như vậy. Có hai cách để cấu hình.

Cách 1: trình hướng dẫn cấu hình (khuyến nghị). Chạy trong terminal ngoài phiên đang hoạt động:

hermes model

Trong danh sách các nhà cung cấp, hãy chọn «Custom endpoint (self-hosted / VLLM / etc.)» và nhập ba giá trị:

API base URL: https://gate.joingonka.ai/v1
API key: jg-khoa-cua-ban
Model name: MiniMaxAI/MiniMax-M2.7

Cách 2: chỉnh sửa tệp cấu hình. Hermes lưu trữ cài đặt mô hình trong ~/.hermes/config.yaml — đây là nguồn sự thật duy nhất. Thêm phần sau:

# ~/.hermes/config.yaml
model:
  provider: custom
  default: MiniMaxAI/MiniMax-M2.7
  base_url: https://gate.joingonka.ai/v1
  api_key: jg-khoa-cua-ban

Kiểm tra: chạy hermes và viết «Tạo tệp hello.py với hàm hello world». Đại lý (agent) sẽ tạo tệp và hiển thị kết quả. Trạng thái cấu hình hiện tại có thể xem qua hermes config show | grep '^model\.' và hermes status.

Chuyển đổi nhanh: trong phiên bằng lệnh /model custom:MiniMaxAI/MiniMax-M2.7. Và /model custom không có tên sẽ tự động lấy mô hình từ endpoint nếu đó là cái duy nhất ở đó.

So sánh chi phí các phiên tự động

Hermes là một công cụ tác nhân với bộ nhớ và kỹ năng. Nó không chỉ phản hồi bằng một câu trả lời đơn lẻ: nó đọc tệp, viết mã, chạy lệnh, nén ngữ cảnh và quản lý các tác vụ nền dài hạn thông qua trình lập lịch. Mỗi hành động là một lệnh gọi API và hàng chục triệu token sẽ tích lũy trong một ngày làm việc tự động. Hãy so sánh chi phí của các phiên làm việc điển hình:

Tác vụ	Token	Anthropic Claude	JoinGonka Gonka
Tác vụ đơn lẻ với tool-calling	~5M	$15 — $75	$0.024
Tác nhân nền (vài giờ)	~20M	$60 — $300	$0.096
Phát triển tính năng tự động	~50M	$150 — $750	$0.24
Hoạt động cả ngày qua cổng (Telegram + cron)	~150M	$450 — $2,250	$0.72

Với JoinGonka Gateway, Hermes có thể được duy trì hoạt động 24/7: báo cáo đêm, kiểm tra hàng tuần, tác vụ nền qua cron-scheduler - mà không cần lo lắng về chi phí. Với biểu giá của Anthropic, mỗi lần chạy như vậy sẽ cần phải tính toán thủ công. 10M token miễn phí khi đăng ký là đủ cho hàng chục phiên làm việc đầy đủ.

Lựa chọn mô hình và tool calling

Thông qua Gateway, người dùng có thể truy cập ngay hai mô hình Gonka — cả hai đều hỗ trợ native tool calling (OpenAI function calling), vì vậy các kỹ năng và công cụ của Hermes hoạt động tin cậy mà không cần parse phản hồi văn bản:

Model name (cho config)	Context	Phản hồi tối đa	Khi nào nên chọn
`moonshotai/Kimi-K2.6`	200K	8192	Mặc định — lập luận mạnh mẽ, coding và kịch bản agent
`MiniMaxAI/MiniMax-M2.7`	200K	8192	Context dài, chuỗi tool-calling dài

Về giới hạn token trong Hermes. Trong config.yaml, trường context_length là cửa sổ ngữ cảnh đầy đủ (đầu vào + đầu ra), còn max_tokens chỉ là trần cho độ dài phản hồi. Tốt nhất là không nên đặt cả hai: Hermes sẽ tự xác định các giá trị chính xác từ nhà cung cấp. Nếu bạn đặt max_tokens thủ công, hãy giữ nó trong giới hạn của mô hình — đối với cả hai mô hình qua Gateway, mức tối đa là 8192. Bạn có thể thay đổi mô hình bất cứ lúc nào bằng lệnh hermes model hoặc trực tiếp trong phiên làm việc qua /model.

Các công cụ terminal tương tự trong cơ sở kiến thức của chúng tôi: Claude Code, Cline.

Hermes Agent + Gonka = tác nhân AI tự động của Nous Research với chi phí thấp. Một ngày làm việc nền tốn $0.15 thay vì $450-2,250 của Anthropic. Cài đặt — nhà cung cấp tùy chỉnh với base_url của cổng của chúng tôi, tool calling gốc, ba mô hình để lựa chọn. 10M token miễn phí đủ cho hàng chục phiên.

← LibreChat + Gonka AI — ChatGPT mã nguồn mở Kilo Code + Gonka AI — Tác nhân AI trong VS Code →

Muốn tìm hiểu thêm?

Khám phá các phần khác hoặc bắt đầu kiếm GNK ngay bây giờ.

Nhận 10M token miễn phí →