A equipe de Tecnologia da Informação de Haiguang concluiu com sucesso a adaptação dos modelos DeepSeek V3 e R1 para Haiguang DCU

2025-02-06 16:00
 185
A equipe de tecnologia da informação de Haiguang concluiu recentemente com sucesso a adaptação dos modelos DeepSeek V3 e R1 à DCU (Unidade de Computação de Profundidade) de Haiguang e os lançou oficialmente. Agora, os usuários podem acessar e baixar modelos relevantes por meio da seção "Fonte de luz" na "Comunidade de desenvolvedores do Photosynthesis" e, então, implantar e usar rapidamente esses modelos com base na plataforma DCU. Os modelos DeepSeek V3 e R1 usam uma série de tecnologias inovadoras, como Multi-Head Latent Attention (MLA), DeepSeekMoE, predição de múltiplos tokens, treinamento de precisão mista FP8, etc., que melhoram significativamente a eficiência do treinamento e o desempenho de inferência do modelo.