知识库章节 ▾

技术

Gonka 网络架构:Sprint、传输代理、DiLoCo

Gonka 不仅仅是“云中的 GPU”。它是一个完整的区块链网络,拥有自己的共识、计算验证和分布式训练。让我们深入研究关键组件。

传输代理 (Transfer Agents):客户端与 GPU 之间的网关

Transfer Agents是Gonka架构的关键组成部分,扮演着客户端与ML-node之间智能网关的角色。当用户发送AI请求时,请求不会直接到达GPU,而是到达Transfer Agent——一个专门的中间节点,它决定哪个GPU将处理此请求。

过程如下:客户端通过OpenAI兼容的API发送标准的POST /v1/chat/completions请求。Transfer Agent验证请求的加密签名,确定所需模型,并找到一个具有合适特性的空闲ML-node。每个ML-node在注册时都会公布其参数:支持的模型、VRAM容量、当前吞吐量和负载。Transfer Agent利用这些数据进行负载均衡——任务均匀分配,而不是集中在一个节点上。

为了实现容错性,网络中有多个Transfer Agents同时运行。如果其中一个发生故障,客户端会自动切换到另一个。每个Transfer Agent通过/v1/identity端点发布其地址,这允许节点和客户端动态发现彼此。Transfer Agents还管理请求队列:如果所有节点都忙,请求将根据佣金优先级排队。这种架构类似于CDN,但专门用于AI计算——分布式、容错且没有单点控制。

Sprint:通过真实推理达成共识

Sprint 是 Transformer PoW 2.0,Gonka 独特的共识机制,与所有现有区块链协议根本不同。在比特币中,矿工消耗 26 GW 的电力来计算无意义的 SHA-256 哈希值——其唯一目的是证明能源已被消耗。在以太坊权益证明中,完全放弃了计算工作——验证者只是锁定代币,为了能源效率牺牲了去中心化。Sprint 提供了第三条道路。

在 Sprint 中,每一次计算都是一个真实的 AI 请求。用户发送提示“编写一个 Python 函数”→ GPU 通过 Qwen3-235B 神经网络生成响应→ 这个推理同时服务用户并在区块链中确认区块。结果是:99% 的网络资源用于有益工作(AI 推理),只有 1% 用于加密安全。相比之下:在比特币中,100% 的能源用于安全,0% 用于有益工作。

网络的工作以时代(epoch)为单位组织。在每个时代中,Transfer Agents 将 AI 任务分配给 ML 节点。在时代结束时,会形成一个包含已完成工作证明的区块。奖励按每个节点的贡献比例分配——GPU 处理的请求越多,它获得的 GNK 就越多。这创造了一种市场激励机制:主机竞相争夺任务,优化性能并降低用户的推理成本。

DiLoCo:分布式模型训练

DiLoCo是一种分布式AI模型训练技术,解决了根本性问题:如何在数十亿参数的神经网络上进行训练,而GPU却分布在不同的国家,并通过普通互联网而非数据中心内部的高速NVLink连接?

传统的训练方法要求在每一步之后同步参数——这只有在数百吉比特/秒的链接速度下才有可能,即在单个NVIDIA集群内部。DiLoCo重新构想了这一过程:节点大约每隔1000步而不是每步同步一次参数。在两次同步之间,每个节点在其数据子集上进行本地训练。这使得对带宽的需求降低了三个数量级,使通过互联网进行训练在实践中可行。

优化在两个层面运作:本地,每个节点使用AdamW——Transformer的标准优化器。全局,在同步时,应用Nesterov动量——一种“预测”更新方向并加速收敛的算法。结果是:可以在由8个H100组成、分布在全球各地、没有中央服务器的集群上训练30-50亿参数的模型。相比之下:训练GPT-4需要一个数据中心内数千个GPU,投资达数十亿美元。DiLoCo可能允许在Gonka的分布式基础设施上达到类似的结果。

这为什么重要?训练是AI最昂贵的部分。像OpenAI这样的公司在一个训练周期上花费数亿美元。DiLoCo允许Gonka随着时间的推移,利用网络自身的力量训练自己的模型——无需建造数十亿美元的数据中心。这使得Gonka不仅仅是一个推理网络,而是一个拥有垂直整合的完整AI平台。

PoC V2:验证节点诚实性

PoC V2——验证机制,确保每个ML-node确实执行了计算,而不是返回随机垃圾数据。这一点至关重要:如果没有验证,攻击者可以注册一个“节点”,返回虚假响应并获得奖励,而无需在GPU上耗费任何电力。

该机制通过交叉验证工作。网络随机选择1-10%的任务,并将其发送给另一个节点重新执行。如果结果匹配——两个节点都会获得奖励。如果结果不匹配——则启动仲裁程序(dispute)。失败的节点会失去20%的抵押品(stake),这些抵押品将分配给诚实的参与者。这种惩罚使得欺诈在经济上不划算:虚假响应的潜在收益远低于失去抵押品的风险。

验证速度由BLS签名确保——这是一种加密原语,可以将多个签名聚合成一个,并在不到10毫秒内完成验证。这意味着诚实性检查不会减慢网络速度——用户可以立即收到响应,而验证则并行进行。

对于模型训练任务(通过DiLoCo),使用了一种额外的机制——Proof-of-Learning。每个节点在每个检查点将模型权重和优化器状态的哈希值记录在区块链中。这创建了一个不可篡改的审计追踪:任何人都可以验证训练确实发生了,并且权重没有被替换。这种双层验证——PoC V2用于推理,Proof-of-Learning用于训练——使得Gonka成为最安全的去中心化AI网络之一,并通过了CertiK的审计。

Gonka 是一个完整的区块链基础设施:传输代理路由请求,Sprint 将共识与 AI 推理相结合,DiLoCo 分布式训练模型,PoC V2 确保诚实性。

想了解更多?

探索其他章节或立即开始赚取 GNK。

通过 Gonka 尝试 AI →