Các phần cơ sở kiến thức ▾

Công cụ

Công cụ

Hermes Agent + Gonka AI — tác nhân tự động với chi phí thấp

Hermes Agent — tác nhân AI tự học mã nguồn mở từ Nous Research (giấy phép MIT). Đây không chỉ là một cuộc trò chuyện: một CLI terminal đầy đủ với bộ nhớ, kỹ năng (skills), bộ lập lịch tác vụ và cổng vào Telegram, Discord, Slack và WhatsApp. Tác nhân tạo ra các kỹ năng từ kinh nghiệm, tìm kiếm qua các cuộc đối thoại trước đây và xây dựng mô hình người dùng giữa các phiên. Nó chạy trên một VPS với giá $5, hoặc trên một cụm GPU.

Vấn đề của Hermes — cũng giống như bất kỳ công cụ tác nhân nào: chi phí token. Tác nhân đọc tệp, chạy vòng lặp tool-calling, nén ngữ cảnh, duy trì bộ nhớ — hàng chục triệu token dễ dàng bị tiêu thụ trong một ngày làm việc tích cực. Với các mô hình Anthropic hoặc OpenAI ($3-15 cho 1M), điều này biến thành hàng chục và hàng trăm đô la mỗi ngày làm việc tự động.

Hermes mặc định hỗ trợ bất kỳ nhà cung cấp nào: Nous Portal, OpenRouter, OpenAI, Anthropic — hoặc điểm cuối của riêng bạn. Đây chính là điểm đầu vào của JoinGonka Gateway: cổng tương thích OpenAI của chúng tôi cung cấp suy luận từ mạng phi tập trung Gonka với giá từ $0.0005 cho 1M token — rẻ hơn hàng trăm và hàng nghìn lần. Hermes trở thành một công cụ thực sự hàng ngày, chứ không phải một bản demo đắt tiền.

Bước 1: Cài đặt Hermes và lấy khóa

Cài đặt Hermes (Linux, macOS, WSL2). Trình cài đặt chính thức sẽ tự động tải Python, Node.js, ripgrep và ffmpeg:

# Linux / macOS / WSL2
curl -fsSL https://hermes-agent.nousresearch.com/install.sh | bash

# Windows (PowerShell)
iex (irm https://hermes-agent.nousresearch.com/install.ps1)

Sau khi cài đặt, khởi động lại shell và kiểm tra việc khởi chạy:

source ~/.bashrc # hoặc ~/.zshrc
hermes # CLI tương tác

Khoá API JoinGonka: nếu chưa có — đăng ký tại gate.joingonka.ai/register, nhận 10 triệu token miễn phí và tạo khoá có tiền tố jg- trong Dashboard. Một khoá và một số dư hoạt động ngay lập tức cho tất cả các mô hình.

Bước 2: Kết nối Gonka làm nhà cung cấp tùy chỉnh

Hermes hoạt động với bất kỳ điểm cuối nào tương thích OpenAI: nếu máy chủ phản hồi /v1/chat/completions — Hermes có thể được hướng đến đó. Gateway JoinGonka chính là một điểm như vậy. Có hai cách cấu hình.

Cách 1: Trình hướng dẫn cài đặt (được khuyến nghị). Chạy trong terminal ngoài phiên hoạt động:

hermes model

Trong danh sách các nhà cung cấp, chọn «Custom endpoint (self-hosted / VLLM / etc.)» và nhập ba giá trị:

  • URL cơ sở API: https://gate.joingonka.ai/v1
  • Khoá API: jg-your-key
  • Tên mô hình: Qwen/Qwen3-235B-A22B-Instruct-2507-FP8

Cách 2: Chỉnh sửa cấu hình. Hermes lưu trữ cài đặt mô hình trong ~/.hermes/config.yaml — đây là nguồn thông tin duy nhất. Thêm phần:

# ~/.hermes/config.yaml
model:
  provider: custom
  default: Qwen/Qwen3-235B-A22B-Instruct-2507-FP8
  base_url: https://gate.joingonka.ai/v1
  api_key: jg-your-key

Kiểm tra: chạy hermes và viết «Tạo một tệp hello.py với hàm hello world». Tác nhân sẽ tạo tệp và hiển thị kết quả. Trạng thái cấu hình hiện tại có thể xem qua hermes config show | grep '^model\.'hermes status.

Chuyển đổi tức thì: trong phiên, bằng lệnh /model custom:Qwen/Qwen3-235B-A22B-Instruct-2507-FP8. Và /model custom không có tên sẽ tự động tải mô hình từ điểm cuối, nếu chỉ có một mô hình đó.

So sánh chi phí các phiên tự động

Hermes — một công cụ tác nhân có bộ nhớ và kỹ năng. Nó không chỉ trả lời bằng một câu trả lời: nó đọc tệp, viết mã, chạy lệnh, nén ngữ cảnh, thực hiện các tác vụ nền dài thông qua bộ lập lịch. Mỗi hành động là một lệnh gọi API, và hàng chục triệu token tích lũy trong một ngày làm việc tự động. Hãy so sánh chi phí của các phiên điển hình:

Tác vụTokenAnthropic ClaudeJoinGonka Gonka
Tác vụ một lần với tool-calling~5M$15 — $75$0.005
Tác nhân nền (vài giờ)~20M$60 — $300$0.02
Phát triển tính năng tự động~50M$150 — $750$0.05
Một ngày làm việc qua cổng (Telegram + cron)~150M$450 — $2,250$0.15

Với JoinGonka Gateway, Hermes có thể được chạy 24/7: báo cáo đêm, kiểm toán hàng tuần, tác vụ nền thông qua bộ lập lịch cron — mà không cần lo lắng về hóa đơn. Với giá của Anthropic, mỗi lần chạy như vậy sẽ phải được tính toán thủ công. 10 triệu token miễn phí khi đăng ký đủ cho hàng chục phiên đầy đủ.

Lựa chọn mô hình và tool calling

Thông qua Gateway, người dùng có thể truy cập ngay ba mô hình Gonka — tất cả đều hỗ trợ tool calling gốc (OpenAI function calling), do đó các kỹ năng và công cụ của Hermes hoạt động đáng tin cậy, không cần phân tích phản hồi văn bản:

Tên mô hình (cho cấu hình)Ngữ cảnhPhản hồi tối đaKhi nào nên chọn
Qwen/Qwen3-235B-A22B-Instruct-2507-FP8128K8192Mặc định — cân bằng chất lượng và tốc độ cho tác vụ tác nhân
moonshotai/Kimi-K2.6128K3072Lý luận và mã hóa mạnh mẽ
MiniMaxAI/MiniMax-M2.7128K4096Kịch bản tác nhân, chuỗi tool-calling dài

Về giới hạn token trong Hermes. Trong config.yaml trường context_length — đây là cửa sổ ngữ cảnh đầy đủ (đầu vào + đầu ra), và max_tokens — giới hạn chỉ độ dài phản hồi. Tốt nhất là không đặt cả hai: Hermes sẽ tự động xác định các giá trị chính xác từ nhà cung cấp. Nếu bạn đặt max_tokens theo cách thủ công, hãy giữ nó trong giới hạn của mô hình — đối với Qwen3-235B, tối đa qua Gateway là 8192. Có thể thay đổi mô hình bất kỳ lúc nào bằng lệnh hermes model hoặc trực tiếp trong phiên thông qua /model.

Các công cụ terminal tương tự trong cơ sở kiến thức của chúng tôi: Claude Code, Cline.

Hermes Agent + Gonka = tác nhân AI tự động của Nous Research với chi phí thấp. Một ngày làm việc nền tốn $0.15 thay vì $450-2,250 của Anthropic. Cài đặt — nhà cung cấp tùy chỉnh với base_url của cổng của chúng tôi, tool calling gốc, ba mô hình để lựa chọn. 10M token miễn phí đủ cho hàng chục phiên.

Muốn tìm hiểu thêm?

Khám phá các phần khác hoặc bắt đầu kiếm GNK ngay bây giờ.

Nhận 10M token miễn phí →