Ekipa Haiguang Information Technology je uspešno zaključila prilagoditev modelov DeepSeek V3 in R1 na Haiguang DCU

2025-02-06 16:00
 185
Ekipa za informacijsko tehnologijo Haiguang je nedavno uspešno zaključila prilagoditev modelov DeepSeek V3 in R1 na Haiguang DCU (Enota za globinsko računanje) in ju uradno predstavila. Zdaj lahko uporabniki dostopajo do ustreznih modelov in jih prenesejo prek razdelka »Light Source« v »Photosynthesis Developer Community« ter nato te modele hitro uvedejo in uporabljajo na podlagi platforme DCU. Modela DeepSeek V3 in R1 uporabljata številne inovativne tehnologije, kot so Multi-Head Latent Attention (MLA), DeepSeekMoE, multi-token prediction, FP8 mešano natančno usposabljanje itd., ki bistveno izboljšajo učinkovitost usposabljanja in zmogljivost sklepanja modela.