Tým Haiguang Information Technology úspěšně dokončil adaptaci modelů DeepSeek V3 a R1 na Haiguang DCU

2025-02-06 16:00
 185
Tým informačních technologií Haiguang nedávno úspěšně dokončil adaptaci modelů DeepSeek V3 a R1 na Haiguang DCU (Deep Computing Unit) a oficiálně je spustil. Nyní mohou uživatelé přistupovat k relevantním modelům a stahovat je prostřednictvím sekce „Light Source“ v „Photosynthesis Developer Community“ a poté rychle nasadit a používat tyto modely založené na platformě DCU. Modely DeepSeek V3 a R1 využívají řadu inovativních technologií, jako je Multi-Head Latent Attention (MLA), DeepSeekMoE, predikce více tokenů, FP8 smíšený precizní trénink atd., které výrazně zlepšují efektivitu tréninku a inferenční výkon modelu.