Haiguang Information Technology-teamet gennemførte med succes tilpasningen af DeepSeek V3- og R1-modeller til Haiguang DCU

185
Haiguang Information Technology Team afsluttede for nylig med succes tilpasningen af DeepSeek V3- og R1-modellerne til Haiguang DCU (Deep Computing Unit) og har officielt lanceret dem. Nu kan brugere få adgang til og downloade relevante modeller gennem afsnittet "Lyskilde" i "Photosynthesis Developer Community", og derefter hurtigt implementere og bruge disse modeller baseret på DCU-platformen. DeepSeek V3 og R1 modellerne bruger en række innovative teknologier, såsom Multi-Head Latent Attention (MLA), DeepSeekMoE, multi-token forudsigelse, FP8 blandet præcisionstræning osv., som markant forbedrer træningseffektiviteten og inferens ydeevne af modellen.