Haiguangs IT-team har framgångsrikt slutfört anpassningen av DeepSeek V3- och R1-modellerna till Haiguang DCU

2025-02-06 16:00
 185
Haiguangs informationsteknikteam slutförde nyligen framgångsrikt anpassningen av DeepSeek V3- och R1-modellerna till Haiguang DCU (Depth Computing Unit), och har officiellt lanserat dem. Nu kan användare komma åt och ladda ner relevanta modeller genom avsnittet "Ljuskälla" i "Fotosyntesutvecklargemenskapen", och sedan snabbt distribuera och använda dessa modeller baserat på DCU-plattformen. DeepSeek V3 och R1-modellerna använder ett antal innovativa teknologier, såsom Multi-Head Latent Attention (MLA), DeepSeekMoE, multi-token prediction, FP8 mixed precision training, etc., som avsevärt förbättrar träningseffektiviteten och slutledningsprestandan hos modellen.