Gonka Netzwerkarchitektur: Sprint, Transfer Agents, DiLoCo

Gonka ist nicht nur „GPU in der Cloud“. Es ist ein vollwertiges Blockchain-Netzwerk mit eigenem Konsens, Überprüfung von Berechnungen und verteiltem Training. Lassen Sie uns die Schlüsselkomponenten betrachten.

Transfer Agents: Gateways zwischen Client und GPU

Transfer Agents sind eine Schlüsselkomponente der Gonka-Architektur, die als intelligenter Gateway zwischen Clients und ML-Knoten fungieren. Wenn ein Benutzer eine KI-Anfrage sendet, gelangt diese nicht direkt zur GPU, sondern zu einem Transfer Agent – einem spezialisierten Vermittlerknoten, der entscheidet, welche GPU diese Anfrage verarbeiten soll.

Der Prozess sieht wie folgt aus: Der Client sendet eine standardmäßige POST /v1/chat/completions-Anfrage über die OpenAI-kompatible API. Der Transfer Agent überprüft die kryptografische Signatur der Anfrage, bestimmt das benötigte Modell und findet einen freien ML-Knoten mit passenden Eigenschaften. Jeder ML-Knoten veröffentlicht bei der Registrierung seine Parameter: welche Modelle er unterstützt, das VRAM-Volumen, die aktuelle Bandbreite und die Auslastung. Der Transfer Agent verwendet diese Daten, um die Last auszugleichen – Aufgaben werden gleichmäßig verteilt und sammeln sich nicht an einem Knoten an.

Zur Ausfallsicherheit arbeiten mehrere Transfer Agents gleichzeitig im Netzwerk. Fällt einer aus, schaltet der Client automatisch auf einen anderen um. Jeder Transfer Agent veröffentlicht seine Adresse über den Endpunkt /v1/identity, was es Knoten und Clients ermöglicht, sich dynamisch gegenseitig zu finden. Transfer Agents verwalten auch Warteschlangen für Anfragen: Wenn alle Knoten belegt sind, wird die Anfrage mit Priorität basierend auf der Gebühr in eine Warteschlange gestellt. Dies ist eine Architektur, die an ein CDN erinnert, jedoch für KI-Berechnungen – verteilt, ausfallsicher und ohne einen einzigen Kontrollpunkt.

Sprint: Konsens durch echte Inferenz

Sprint ist ein Transformer PoW 2.0, der einzigartige Gonka-Konsens, der sich grundlegend von allen bestehenden Blockchain-Protokollen unterscheidet. Bei Bitcoin verbrauchen Miner 26 GW Leistung für die Berechnung sinnloser SHA-256-Hashes – deren einziger Zweck darin besteht, zu beweisen, dass Energie verbraucht wurde. Bei Ethereum Proof of Stake wird gänzlich auf Rechenarbeit verzichtet – Validatoren sperren lediglich Token und opfern die Dezentralisierung zugunsten der Energieeffizienz. Sprint bietet einen dritten Weg.

Bei Sprint ist jede Berechnung eine echte KI-Anfrage. Der Benutzer sendet einen Prompt „Schreib eine Funktion in Python“ → die GPU generiert eine Antwort über das neuronale Netzwerk Qwen3-235B → diese Inferenz bedient gleichzeitig den Benutzer und bestätigt einen Block in der Blockchain. Das Ergebnis: 99 % der Netzwerkressourcen fließen in nützliche Arbeit (KI-Inferenz) und nur 1 % in die kryptografische Sicherheit. Zum Vergleich: Bei Bitcoin gehen 100 % der Energie in die Sicherheit, 0 % in nützliche Arbeit.

Die Netzwerkarbeit ist in Epochen organisiert. In jeder Epoche verteilen Transfer Agents KI-Aufgaben an ML-Knoten. Am Ende der Epoche wird ein Block gebildet, der Nachweise der abgeschlossenen Arbeit enthält. Die Belohnungen werden proportional zum Beitrag jedes Knotens verteilt – je mehr Anfragen eine GPU verarbeitet hat, desto mehr GNK erhält sie. Dies schafft einen marktwirtschaftlichen Anreiz: Hosts konkurrieren um Aufgaben, optimieren die Leistung und senken die Inferenzkosten für Benutzer.

DiLoCo: verteiltes Modelltraining

DiLoCo ist eine Technologie für verteiltes KI-Modelltraining, die ein grundlegendes Problem löst: Wie trainiert man ein neuronales Netzwerk mit Milliarden von Parametern, wenn die GPUs in verschiedenen Ländern stehen und über das normale Internet und nicht über Hochgeschwindigkeits-NVLink innerhalb eines Rechenzentrums verbunden sind?

Der traditionelle Trainingsansatz erfordert eine Parametersynchronisation nach jedem Schritt – dies ist nur bei Kommunikationsgeschwindigkeiten von Hunderten von Gigabit/s möglich, also innerhalb eines NVIDIA-Clusters. DiLoCo überdenkt den Prozess: Knoten synchronisieren Parameter nur etwa alle 1000 Schritte, nicht nach jedem. Zwischen den Synchronisationen lernt jeder Knoten lokal an seiner Untermenge von Daten. Dies reduziert die Anforderungen an die Bandbreite um drei Größenordnungen, wodurch Training über das Internet praktisch machbar wird.

Die Optimierung erfolgt auf zwei Ebenen: Lokal verwendet jeder Knoten AdamW – einen Standardoptimierer für Transformatoren. Global, bei der Synchronisation, wird Nesterov-Momentum angewendet – ein Algorithmus, der die Aktualisierungsrichtung „vorhersagt“ und die Konvergenz beschleunigt. Das Ergebnis: Modelle mit 30–50 Milliarden Parametern können auf Clustern von 8xH100, die über den Planeten verteilt sind, ohne zentralen Server trainiert werden. Zum Vergleich: Das Training von GPT-4 erforderte Tausende von GPUs in einem einzigen Rechenzentrum mit Investitionen in Milliardenhöhe. DiLoCo ermöglicht es Gonka potenziell, ein vergleichbares Ergebnis auf einer verteilten Infrastruktur zu erzielen.

Warum ist das wichtig? Training ist der teuerste Teil der KI. Unternehmen wie OpenAI geben Hunderte von Millionen für einen Trainingszyklus aus. DiLoCo ermöglicht es Gonka, im Laufe der Zeit eigene Modelle mit den Kräften des Netzwerks zu trainieren – ohne milliardenhohe Rechenzentren bauen zu müssen. Dies macht Gonka nicht nur zu einem Inferenz-Netzwerk, sondern zu einer vollwertigen KI-Plattform mit vertikaler Integration.

PoC V2: Überprüfung der Ehrlichkeit von Knoten

PoC V2 – ein Verifizierungsmechanismus, der sicherstellt, dass jeder ML-Knoten die Berechnung tatsächlich durchgeführt hat und nicht zufälligen Müll zurückgegeben hat. Das ist kritisch wichtig: Ohne Verifizierung könnte ein Angreifer einen „Knoten“ registrieren, der gefälschte Antworten liefert und Belohnungen erhält, ohne ein Watt an GPU zu verbrauchen.

Der Mechanismus funktioniert über eine Kreuzprüfung. Das Netzwerk wählt zufällig 1–10 % der Aufgaben aus und sendet sie zur erneuten Ausführung an einen anderen Knoten. Stimmen die Ergebnisse überein, erhalten beide Knoten eine Belohnung. Wenn die Ergebnisse abweichen, beginnt ein Schiedsverfahren (Dispute). Der verlierende Knoten verliert 20 % seines Einsatzes (Stake), der unter den ehrlichen Teilnehmern verteilt wird. Diese Strafe macht Betrug wirtschaftlich unattraktiv: Der potenzielle Gewinn aus gefälschten Antworten ist deutlich geringer als das Risiko, den Einsatz zu verlieren.

Die Geschwindigkeit der Verifizierung wird durch BLS-Signaturen gewährleistet – ein kryptografisches Primitiv, das es ermöglicht, eine Vielzahl von Signaturen zu einer einzigen zu aggregieren und diese in weniger als 10 Millisekunden zu verifizieren. Das bedeutet, dass die Ehrlichkeitprüfung die Netzwerkleistung nicht beeinträchtigt – der Benutzer erhält die Antwort ohne Verzögerung, während die Verifizierung parallel erfolgt.

Für Aufgaben des Modelltrainings (über DiLoCo) wird ein zusätzlicher Mechanismus verwendet – Proof-of-Learning. Jeder Knoten zeichnet in der Blockchain die Hashes der Modellgewichte und des Optimierungszustands an jedem Checkpoint auf. Dies schafft einen unveränderlichen Audit-Trail: Jeder kann überprüfen, ob das Training tatsächlich stattgefunden hat und die Gewichte nicht manipuliert wurden. Eine solche zweistufige Verifizierung – PoC V2 für Inference, Proof-of-Learning für das Training – macht Gonka zu einem der am besten geschützten dezentralen KI-Netzwerke, das von CertiK geprüft wurde.

Gonka – eine vollständige Blockchain-Infrastruktur: Transfer Agents leiten Anfragen weiter, Sprint kombiniert Konsens mit KI-Inferenz, DiLoCo trainiert Modelle verteilt, und PoC V2 garantiert Ehrlichkeit.

Entwickler: Wie man GNK verdient →

Möchten Sie mehr erfahren?

Erkunden Sie andere Abschnitte oder beginnen Sie jetzt GNK zu verdienen.

KI über Gonka ausprobieren →