Het Haiguang Information Technology-team heeft de aanpassing van de DeepSeek V3- en R1-modellen aan Haiguang DCU succesvol afgerond

185
Het Haiguang Information Technology Team heeft onlangs de aanpassing van de DeepSeek V3- en R1-modellen aan de Haiguang DCU (Depth Computing Unit) succesvol afgerond en deze officieel gelanceerd. Gebruikers kunnen nu via de sectie 'Lichtbron' in de 'Photosynthesis Developer Community' relevante modellen openen en downloaden. Vervolgens kunnen ze deze modellen snel implementeren en gebruiken op basis van het DCU-platform. De DeepSeek V3- en R1-modellen maken gebruik van een aantal innovatieve technologieën, zoals Multi-Head Latent Attention (MLA), DeepSeekMoE, multi-token prediction, FP8 mixed precision training, etc., die de trainingsefficiëntie en de inferentieprestaties van het model aanzienlijk verbeteren.