Haiguang informācijas tehnoloģiju komanda veiksmīgi pabeidza DeepSeek V3 un R1 modeļu pielāgošanu Haiguang DCU

2025-02-06 16:00
 185
Haiguang informācijas tehnoloģiju komanda nesen veiksmīgi pabeidza DeepSeek V3 un R1 modeļu pielāgošanu Haiguang DCU (Depth Computing Unit) un ir tos oficiāli laidusi klajā. Tagad lietotāji var piekļūt un lejupielādēt attiecīgos modeļus, izmantojot sadaļu "Gaismas avots" "Photosynthesis Developer Community" un pēc tam ātri izvietot un izmantot šos modeļus, pamatojoties uz DCU platformu. DeepSeek V3 un R1 modeļos tiek izmantotas vairākas inovatīvas tehnoloģijas, piemēram, Multi-Head Latent Attention (MLA), DeepSeekMoE, vairāku marķieru prognozēšana, FP8 jaukta precizitātes apmācība utt., kas ievērojami uzlabo modeļa apmācības efektivitāti un secinājumu veiktspēju.