Die Haiguang Inligtingstegnologie-span het die aanpassing van DeepSeek V3- en R1-modelle by Haiguang DCU suksesvol voltooi

2025-02-06 16:00
 185
Die Haiguang Inligtingstegnologie-span het onlangs die aanpassing van die DeepSeek V3- en R1-modelle na die Haiguang DCU (Depth Computing Unit) suksesvol voltooi en het hulle amptelik bekendgestel. Nou kan gebruikers toegang tot relevante modelle kry en dit aflaai deur die "Ligbron"-afdeling in die "Fotosintese-ontwikkelaargemeenskap", en dan vinnig hierdie modelle ontplooi en gebruik op grond van die DCU-platform. Die DeepSeek V3- en R1-modelle gebruik 'n aantal innoverende tegnologieë, soos Multi-Head Latent Attention (MLA), DeepSeekMoE, multi-token voorspelling, FP8 gemengde presisie opleiding, ens., wat die opleidingsdoeltreffendheid en afleidingsprestasie van die model aansienlik verbeter.