Tim Haiguang Information Technology uspješno je dovršio adaptaciju DeepSeek V3 i R1 modela na Haiguang DCU

185
Haiguang Information Technology Team nedavno je uspješno dovršio prilagodbu modela DeepSeek V3 i R1 na Haiguang DCU (Deep Computing Unit) te ih službeno lansirao. Korisnici sada mogu pristupiti relevantnim modelima i preuzeti ih putem odjeljka "Izvor svjetla" u "Zajednici razvojnih programera Photosynthesis", a zatim brzo implementirati i koristiti te modele temeljene na DCU platformi. Modeli DeepSeek V3 i R1 koriste brojne inovativne tehnologije, kao što su Multi-Head Latent Attention (MLA), DeepSeekMoE, multi-token prediction, FP8 mixed precision training, itd., koje značajno poboljšavaju učinkovitost treninga i performanse zaključivanja modela.