Echipa Haiguang Information Technology a finalizat cu succes adaptarea modelelor DeepSeek V3 și R1 la Haiguang DCU

2025-02-06 16:00
 185
Echipa Haiguang Information Technology a finalizat recent cu succes adaptarea modelelor DeepSeek V3 și R1 la Haiguang DCU (Depth Computing Unit) și le-a lansat oficial. Acum, utilizatorii pot accesa și descărca modele relevante prin secțiunea „Sursă de lumină” din „Comunitatea dezvoltatorilor Photosynthesis”, apoi pot implementa și utiliza rapid aceste modele pe baza platformei DCU. Modelele DeepSeek V3 și R1 folosesc o serie de tehnologii inovatoare, cum ar fi Multi-Head Latent Attention (MLA), DeepSeekMoE, predicție multi-token, antrenament de precizie mixtă FP8 etc., care îmbunătățesc semnificativ eficiența antrenamentului și performanța de inferență a modelului.