El equipo de Tecnología de la Información de Haiguang completó con éxito la adaptación de los modelos DeepSeek V3 y R1 a Haiguang DCU

185
El equipo de tecnología de la información de Haiguang completó recientemente con éxito la adaptación de los modelos DeepSeek V3 y R1 a la DCU (Unidad de computación de profundidad) de Haiguang y los lanzó oficialmente. Ahora, los usuarios pueden acceder y descargar modelos relevantes a través de la sección "Fuente de luz" en la "Comunidad de desarrolladores de fotosíntesis", y luego implementar y usar rápidamente estos modelos basados en la plataforma DCU. Los modelos DeepSeek V3 y R1 utilizan una serie de tecnologías innovadoras, como Multi-Head Latent Attention (MLA), DeepSeekMoE, predicción de múltiples tokens, entrenamiento de precisión mixta FP8, etc., que mejoran significativamente la eficiencia del entrenamiento y el rendimiento de inferencia del modelo.