Teknolohiya

DiLoCo: Distributed Model Training sa Gonka

Ang malalaking modelo ng wika tulad ng GPT o Qwen ay sinasanay sa malalaking kumpol ng GPU, na konektado sa pamamagitan ng napakabilis na channel. Binabago ng DiLoCo (Distributed Local Computation) ang mga patakaran ng laro — pinapayagan nitong sanayin ang ganoong mga modelo sa pamamagitan ng ordinaryong internet, nang walang nag-iisang data center.

Bakit Kailangan ang Distributed Training

Naglalaman ang mga modernong modelo ng AI ng daan-daang bilyong parameter. Ang pag-e-ensayo ng ganoong modelo ay nangangailangan ng daan-daang GPU na sabay-sabay na gumagana. Ang tradisyonal na paraan ay ang pagkolekta ng lahat ng GPU sa isang data center at ikonekta ang mga ito sa InfiniBand. Ito ay mahal, nililimitahan ang sukat, at lumilikha ng isang solong punto ng pagkabigo. Pinapayagan ng DiLoCo na ipamahagi ang pag-e-ensayo sa mga kumpol sa iba't ibang bahagi ng mundo.

Paano Gumagana ang DiLoCo

Ang bawat GPU cluster (halimbawa, 8xH100) ay nagsasanay ng modelo nang lokal, gamit ang AdamW optimizer. Sa bawat ~1,000 hakbang, nag-sy-synchronize ang mga cluster sa isa't isa sa pamamagitan ng isang global optimizer (Nesterov momentum). Ang synchronization ay nangangailangan ng minimal na bandwidth — sapat na ang ordinaryong internet channel. Ito ay radikal na naiiba sa klasikal na approach, kung saan ang mga GPU ay nagpapalitan ng data sa bawat hakbang.

Ano ang Ibinibigay Nito sa Gonka Network

Salamat sa DiLoCo, maaaring magsanay ang Gonka ng mga modelong may 30–50 bilyong parameter, gamit ang mga GPU ng host na nakakalat sa buong mundo. Hindi na kailangan ang isang sentralisadong data center — sapat na ang mga cluster ng 8 GPU na may koneksyon sa internet. Ginagawa nitong tunay na desentralisado ang pagsasanay ng AI at binubuksan ang daan para sa mga modelong sinasanay mismo ng komunidad.
DiLoCo — teknolohiya para sa pagsasanay ng mga modelo ng AI sa internet. Ang mga GPU cluster ay gumagana nang independyente at paminsan-minsan lang nag-sy-synchronize, na nagpapahintulot sa Gonka na magsanay ng mga modelo nang walang sentralisadong data center.

Gusto mo bang matuto pa?

Unawain ang ekonomiya ng GNK o magsimulang kumita ngayon.

Basahin din