Công nghệ

Sprint: cơ chế đồng thuận của Gonka hoạt động như thế nào

Trong mỗi mạng blockchain, có một vấn đề cơ bản: làm thế nào hàng ngàn máy tính độc lập trên toàn thế giới đồng ý về “sự thật” – giao dịch nào đã diễn ra, ai nhận được phần thưởng, khối nào tiếp theo? Trong Bitcoin, nhiệm vụ này được giải quyết bằng việc băm vô nghĩa, đốt cháy ~150 TWh mỗi năm – nhiều hơn mức tiêu thụ của Argentina. Trong Gonka, nhiệm vụ tương tự được giải quyết bởi Sprint – một cơ chế đồng thuận thế hệ mới, được xây dựng trên nguyên tắc Proof of Useful Work. Mỗi lần xác nhận khối là một phản hồi AI thực tế cho một yêu cầu thực tế của người dùng. 99% sức mạnh tính toán của mạng được hướng đến công việc hữu ích, và chỉ 1% dành cho bảo mật mật mã. Không một watt năng lượng nào bị lãng phí.

Sprint là gì và tại sao nó cần thiết

Đồng thuận là cơ chế mà qua đó tất cả các nút trong mạng đồng ý về trạng thái hiện tại của blockchain. Nếu không có nó, mỗi nút sẽ thấy phiên bản “sự thật” của riêng mình, và mạng sẽ không thể hoạt động. Trong lịch sử blockchain, đã có ba thế hệ đồng thuận:

  • PoW (Bitcoin, 2009) – thợ đào tìm kiếm các hàm băm SHA-256 vô nghĩa. An toàn, nhưng lãng phí: 100% năng lượng dành cho “xổ số kỹ thuật số”.
  • PoS (Ethereum, 2022) – người xác thực khóa token làm tài sản thế chấp. Tiết kiệm năng lượng, nhưng hy sinh tính phi tập trung: các bên đặt cược lớn (Lido, Coinbase) kiểm soát một phần đáng kể của mạng.
  • Sprint / PoUW (Gonka, 2025) – con đường thứ ba. GPU thực hiện các tính toán AI thực tế, đồng thời phục vụ người dùng và xác nhận các khối.

Sprint là Transformer PoW 2.0, một cơ chế đồng thuận độc đáo của Gonka. Tên gọi phản ánh bản chất: công việc của mạng được tổ chức thành các cuộc chạy nước rút (kỷ nguyên), mỗi cuộc chạy đại diện cho một chu trình thực hiện, xác minh và phân phối phần thưởng. Không giống như Bitcoin, nơi “công việc” là việc thử các số ngẫu nhiên, trong Sprint, công việc là một lượt forward pass thông qua mạng neuron Qwen3-235B với 235 tỷ tham số.

Quy mô mạng: hiện tại Gonka có ~4.648 GPU đang hoạt động, được kết hợp thành ~582 nút ML. Mỗi nút ML là một máy chủ GPU với tối thiểu 40 GB VRAM, có khả năng xử lý các yêu cầu đến mạng neuron. Để phục vụ đầy đủ mô hình Qwen3-235B (kiến trúc MoE, 22B tham số hoạt động) cần một cụm GPU với tổng VRAM 640 GB. Sprint điều phối tất cả các tài nguyên này theo thời gian thực, phân phối nhiệm vụ và theo dõi đóng góp của từng người tham gia.

Trong mạng Gonka, những người tham gia đóng các vai trò khác nhau, và Sprint điều phối sự tương tác của họ. Chủ máy (thợ đào) cung cấp GPU để suy luận và đào tạo mô hình – họ nhận GNK cả từ phát hành ban đầu và để thanh toán cho các yêu cầu đã thực hiện. Đại lý chuyển giao – các nút điều phối chuyên biệt, tiếp nhận các yêu cầu AI đến, kiểm tra chữ ký mật mã và định tuyến các yêu cầu đến các nút ML phù hợp có tính đến tải, mô hình có sẵn và độ trễ. Người xác thực đảm bảo kiểm toán mật mã – kiểm tra xem các nút có thực hiện tính toán một cách trung thực hay không. Tất cả các vai trò đều có động lực kinh tế thông qua phần thưởng GNK, và Sprint đảm bảo sự phối hợp của họ mà không có sự kiểm soát tập trung.

Mạng hoàn toàn không cần cấp phép – bất kỳ chủ sở hữu GPU phù hợp nào cũng có thể kết nối mà không cần KYC, bằng cách cài đặt cosmovisor và MLNode. Định tuyến tác vụ giữa các nút diễn ra theo đặc tính phần cứng, tính khả dụng và danh tiếng của nút. Quyền biểu quyết trong mạng (Proof of Compute) được xác định bởi khối lượng công việc tính toán: “một đơn vị sức mạnh tính toán = một phiếu bầu”. Điều này khác biệt cơ bản với PoS, nơi phiếu bầu được xác định bởi vốn.

Điểm khác biệt chính so với các tiền thân: Sprint không phải là một giao thức “trống rỗng” gắn liền với độ phức tạp trừu tượng. Mỗi khối chứa bằng chứng về công việc thực sự đã được thực hiện – các phản hồi của mạng neuron đã được gửi đến người dùng. Điều này tạo ra một mối liên hệ trực tiếp giữa bảo mật mạng và tính hữu ích của nó: càng nhiều yêu cầu AI được mạng xử lý, mạng càng an toàn.

Bitcoin PoW và Gonka Sprint: so sánh

Để hiểu tại sao Sprint là một sự phát triển, chứ không chỉ là “một blockchain khác”, thật hữu ích khi so sánh nó với Proof of Work cổ điển trong Bitcoin:

Tiêu chíBitcoin PoWGonka Sprint
Loại công việcTìm kiếm hàm băm SHA-256 (vô nghĩa)Suy luận AI – phản hồi mạng neuron Qwen3-235B
Tính hữu ích0% – không một hàm băm nào tạo ra giá trị99% công suất dành cho công việc hữu ích, 1% để xác minh
Hiệu quả năng lượng~26 GW (≈150 TWh/năm) lãng phíMỗi watt tạo ra giá trị thực
Thiết bịMáy đào ASIC (vô dụng ngoài Bitcoin)GPU NVIDIA (đa năng, H100/H200/A100)
Xác minhĐơn giản: băm < mục tiêuPoC V2: kiểm tra chéo 1–10% tác vụ + chữ ký BLS
Khả năng mở rộng~7 giao dịch/giâyThông lượng tăng theo số lượng GPU
Phần thưởng6.25 BTC/khối (cố định cho đến khi giảm một nửa)Tỷ lệ thuận với khối lượng yêu cầu AI đã xử lý
Nguồn giá trị“Sự khan hiếm” trừu tượngThị trường AI-computations thực tế (150+ tỷ USD/năm)

Điểm khác biệt chính – ở nguồn giá trị. Giá trị của Bitcoin dựa trên “vàng kỹ thuật số” – phát hành hạn chế và sự đồng thuận về giá trị. Giá trị của GNK gắn liền với nhu cầu thực tế về các tính toán AI. Khi ai đó gửi yêu cầu thông qua API Gonka, họ trả GNK cho một kết quả cụ thể – phản hồi của mạng neuron. Đây là nhu cầu tiện ích, không phải đầu cơ.

Điểm khác biệt quan trọng thứ hai – khả năng mở rộng. Bitcoin không thể mở rộng: nhiều ASIC = nhiều năng lượng lãng phí, nhưng không nhiều giao dịch hơn. Trong Sprint, mỗi GPU mới làm tăng thông lượng mạng – nhiều yêu cầu được xử lý song song, các khối được tạo nhanh hơn. Sự phát triển của mạng không dẫn đến lãng phí năng lượng, mà làm tăng sức mạnh hữu ích của nó.

Điểm khác biệt thứ ba – tính phổ biến của thiết bị. Máy đào ASIC Bitcoin vô dụng ngoài việc đào – đây là các chip chuyên dụng chỉ có thể tính SHA-256. GPU được sử dụng trong Gonka (H100, H200, A100) là các bộ tăng tốc tính toán đa năng. Nếu chủ máy quyết định rời mạng, thiết bị của họ vẫn giữ nguyên giá trị – nó có thể được sử dụng để hiển thị, tính toán khoa học, đào tạo mô hình hoặc bán trên thị trường thứ cấp.

Điểm khác biệt thứ tư – mô hình kinh tế của phần thưởng. Trong Bitcoin, phần thưởng được cố định và giảm một nửa sau mỗi ~4 năm (halving), bất kể lượng công việc thực tế đã được thực hiện. Trong Sprint, phần thưởng được phân phối tỷ lệ thuận với trọng số Proof-of-Compute đang hoạt động – chủ máy càng xử lý nhiều yêu cầu AI, họ càng nhận được nhiều GNK. Đồng thời, chủ máy nhận được hai dòng thu nhập song song: token từ phát hành ban đầu (80% tổng số 1 tỷ GNK được phân phối cho chủ máy) và khoản thanh toán từ người dùng cho suy luận (80% từ mỗi yêu cầu AI). Để tối đa hóa phần thưởng, chủ máy khóa GNK làm tài sản thế chấp (collateral) – không có tài sản thế chấp, trọng lượng của nút giảm 5 lần. Điều này tạo ra động lực kinh tế cho sự tham gia lâu dài vào mạng, chứ không phải cho việc “vào-ra” nhanh chóng.

Bảo mật của Sprint đã được xác nhận bằng cuộc kiểm toán của CertiK – công ty kiểm toán Web3 hàng đầu, hoàn thành việc kiểm tra vào tháng 9 năm 2025. Dự án đã thu hút ~80 triệu USD đầu tư từ Coatue, Bitfury (50 triệu USD Series B), Insight Partners và Benchmark – đây là sự xác nhận từ các tổ chức về tính khả thi của mô hình Sprint như một cơ chế đồng thuận thế hệ mới.

Sprint hoạt động như thế nào trong thực tế

Hãy xem xét toàn bộ chu trình xử lý yêu cầu AI trong mạng Gonka – từ thời điểm người dùng nhấp vào “Gửi” cho đến khi nhận được phản hồi và phân phối phần thưởng:

  1. Yêu cầu: người dùng (hoặc ứng dụng) gửi một POST /v1/chat/completions tiêu chuẩn thông qua API tương thích OpenAI. Yêu cầu được ký bằng khóa mật mã của ví – điều này chứng minh rằng người gửi có đủ tiền để thanh toán.
  2. Định tuyến: yêu cầu được gửi đến Transfer Agent – một nút điều phối chuyên biệt. Transfer Agent kiểm tra chữ ký, xác định mô hình cần thiết và tìm một nút ML trống với các đặc tính phù hợp (đủ VRAM, đã tải mô hình cần thiết, độ trễ tối thiểu). Nhiều Transfer Agent hoạt động đồng thời trong mạng để đảm bảo dự phòng.
  3. Suy luận (giai đoạn tính toán): nút ML đã chọn thực hiện lượt forward pass thông qua mạng neuron Qwen3-235B. GPU tạo ra phản hồi từng token một ở chế độ truyền phát. Người dùng nhận được phản hồi theo thời gian thực – độ trễ là tối thiểu.
  4. Xác minh (PoC V2): song song với việc xử lý yêu cầu, mạng kiểm tra tính trung thực của các nút. 1–10% tác vụ được gửi ngẫu nhiên để một nút khác thực hiện lại. Các kết quả được so sánh. Nếu trùng khớp – cả hai nút xác nhận tính trung thực của mình. Nếu không – bắt đầu quy trình trọng tài, và nút không trung thực sẽ mất 20% tài sản thế chấp. Chữ ký BLS cho phép xác minh kết quả trong vòng chưa đầy 10 mili giây.
  5. Tạo khối: khi kỷ nguyên kết thúc, tất cả các bằng chứng về công việc đã thực hiện được tổng hợp thành một khối. Khối chứa: các hàm băm của các yêu cầu đã thực hiện, chữ ký BLS xác minh, dữ liệu về đóng góp của mỗi nút.
  6. Phân phối phần thưởng: phần thưởng GNK được phân bổ tỷ lệ thuận với đóng góp của mỗi nút. 80% từ khoản thanh toán cho suy luận sẽ thuộc về chủ máy đã xử lý yêu cầu. 20% được chuyển vào Community Pool – quỹ phát triển hệ sinh thái (đào tạo mô hình, tài trợ). Ngoài ra, chủ máy nhận được token từ phát hành ban đầu – đây là hai dòng thu nhập song song.

Toàn bộ quá trình diễn ra trong vài giây. Người dùng không thấy cơ chế blockchain – đối với họ, đó là một yêu cầu API thông thường đến mạng neuron, giống như ChatGPT, chỉ rẻ hơn hàng nghìn lần. Giá suy luận mạng hiện tại – khoảng 0,0021 USD cho một triệu token, so với 2,50–15 USD cho một triệu token của OpenAI.

Định giá động – một tính năng khác của Sprint. Giá suy luận được tính toán lại mỗi khối tùy thuộc vào tải của mạng. Trong vùng ổn định (40–60% sử dụng), giá không thay đổi. Dưới 40% – giá tự động giảm để thu hút người dùng. Trên 60% – tăng để khuyến khích kết nối thêm GPU mới. Thay đổi tối đa – 2% mỗi khối. Điều này tạo ra một cơ chế thị trường nơi cung và cầu tự động được cân bằng, không cần can thiệp thủ công.

Bảo mật thông qua DiLoCo: ngoài suy luận, Sprint còn điều phối việc đào tạo mô hình phân tán. Các cụm GPU trên khắp thế giới đào tạo cục bộ và đồng bộ hóa khoảng 1000 bước một lần thông qua giao thức DiLoCo. Điều này cho phép Gonka không chỉ phục vụ mà còn đào tạo các mô hình AI – mà không cần phải tập hợp tất cả các GPU vào một trung tâm dữ liệu. Trong lộ trình cho năm 2026–2027 – suy luận đa mô hình, khi các chủ máy có thể phục vụ các mô hình khác nhau tùy thuộc vào GPU của họ. Sprint biến Gonka từ một mạng suy luận thành một nền tảng AI hoàn chỉnh.

Bảo mật ở cấp độ giao thức: để bảo vệ khỏi các cuộc tấn công vào cơ chế đồng thuận, Gonka có các nút Guardian – 3 nút đặc biệt kiểm soát 34% số phiếu bầu. Điều này đảm bảo rằng kẻ tấn công không thể giành quyền kiểm soát mạng, ngay cả khi có nguồn lực tính toán đáng kể. Các nút Guardian được giới thiệu trong phiên bản v0.2.7 (tháng 1 năm 2026) như một lớp bảo mật bổ sung ở giai đoạn phát triển ban đầu của mạng. Khi số lượng nút độc lập tăng lên, vai trò của các nút Guardian sẽ dần được giảm bớt thông qua quản trị on-chain – một quy trình quản trị trong đó tất cả những người tham gia bỏ phiếu bằng token và trọng số PoC. Đây là một thực tiễn tiêu chuẩn cho các mạng blockchain mới: bắt đầu với một lần khởi chạy có kiểm soát và dần dần chuyển sang phi tập trung hóa hoàn toàn.

Sprint – cơ chế đồng thuận của Gonka, nơi việc xác nhận khối tương đương với việc thực hiện một yêu cầu AI thực tế. 99% sức mạnh tính toán được dành cho công việc hữu ích, 1% – để xác minh mật mã. Không giống như Bitcoin, mỗi watt năng lượng tạo ra giá trị thực – phản hồi của mạng neuron cho người dùng. Điều này làm cho GNK trở thành một token gắn liền với thị trường AI-computations thực tế (150+ tỷ USD/năm), chứ không phải sự “khan hiếm” trừu tượng. Sprint đã vượt qua cuộc kiểm toán của CertiK, hoạt động từ tháng 8 năm 2025 và được phục vụ bởi ~4.648 GPU trên toàn thế giới.

Bạn muốn tìm hiểu thêm?

Hiểu rõ hơn về nền kinh tế GNK hoặc bắt đầu kiếm tiền ngay bây giờ.

Đọc thêm