L'équipe informatique de Haiguang a terminé avec succès l'adaptation des modèles DeepSeek V3 et R1 à Haiguang DCU

2025-02-06 16:00
 185
L'équipe informatique de Haiguang a récemment terminé avec succès l'adaptation des modèles DeepSeek V3 et R1 à l'unité de calcul profond (Deep Computing Unit) de Haiguang et les a officiellement lancés. Désormais, les utilisateurs peuvent accéder et télécharger des modèles pertinents via la section « Source de lumière » de la « Communauté de développeurs de photosynthèse », puis déployer et utiliser rapidement ces modèles sur la base de la plate-forme DCU. Les modèles DeepSeek V3 et R1 utilisent un certain nombre de technologies innovantes, telles que Multi-Head Latent Attention (MLA), DeepSeekMoE, la prédiction multi-jetons, la formation de précision mixte FP8, etc., qui améliorent considérablement l'efficacité de la formation et les performances d'inférence du modèle.