Haiguang Information Technology-teamet fullførte vellykket tilpasningen av DeepSeek V3- og R1-modellene til Haiguang DCU

185
Haiguang Information Technology Team fullførte nylig med suksess tilpasningen av DeepSeek V3- og R1-modellene til Haiguang DCU (Depth Computing Unit), og har offisielt lansert dem. Nå kan brukere få tilgang til og laste ned relevante modeller gjennom delen "Lyskilde" i "Photosynthesis Developer Community", og deretter raskt distribuere og bruke disse modellene basert på DCU-plattformen. DeepSeek V3- og R1-modellene bruker en rekke innovative teknologier, som Multi-Head Latent Attention (MLA), DeepSeekMoE, multi-token prediksjon, FP8 blandet presisjonstrening, etc., som betydelig forbedrer treningseffektiviteten og slutningsytelsen til modellen.