Zespół Haiguang Information Technology pomyślnie ukończył adaptację modeli DeepSeek V3 i R1 do Haiguang DCU

2025-02-06 16:00
 185
Zespół Haiguang Information Technology niedawno pomyślnie ukończył adaptację modeli DeepSeek V3 i R1 do jednostki obliczeniowej głębi Haiguang DCU (Depth Computing Unit) i oficjalnie je uruchomił. Teraz użytkownicy mogą uzyskiwać dostęp do odpowiednich modeli i pobierać je za pośrednictwem sekcji „Źródło światła” w „Społeczności programistów fotosyntezy”, a następnie szybko wdrażać i wykorzystywać te modele w oparciu o platformę DCU. Modele DeepSeek V3 i R1 wykorzystują szereg innowacyjnych technologii, takich jak Multi-Head Latent Attention (MLA), DeepSeekMoE, predykcja wielotokenowa, trening o mieszanej precyzji FP8 itp., które znacznie zwiększają efektywność treningu i wydajność wnioskowania modelu.