Tím informačných technológií Haiguang úspešne dokončil adaptáciu modelov DeepSeek V3 a R1 na Haiguang DCU

2025-02-06 16:00
 185
Tím informačných technológií Haiguang nedávno úspešne dokončil adaptáciu modelov DeepSeek V3 a R1 na Haiguang DCU (Depth Computing Unit) a oficiálne ich spustil. Teraz môžu používatelia pristupovať k relevantným modelom a sťahovať ich cez sekciu „Light Source“ v „Photosynthesis Developer Community“ a potom rýchlo nasadiť a používať tieto modely založené na platforme DCU. Modely DeepSeek V3 a R1 využívajú množstvo inovatívnych technológií, ako je Multi-Head Latent Attention (MLA), DeepSeekMoE, predikcia viacerých tokenov, FP8 zmiešaný precízny tréning atď., ktoré výrazne zlepšujú efektivitu tréningu a inferenčný výkon modelu.