Ekipi i Teknologjisë së Informacionit të Haiguang përfundoi me sukses përshtatjen e modeleve DeepSeek V3 dhe R1 në Haiguang DCU

2025-02-06 16:00
 185
Ekipi i Teknologjisë së Informacionit të Haiguang së fundmi përfundoi me sukses përshtatjen e modeleve DeepSeek V3 dhe R1 në Haiguang DCU (Depth Computing Unit) dhe i ka lançuar ato zyrtarisht. Tani, përdoruesit mund të aksesojnë dhe shkarkojnë modelet përkatëse përmes seksionit "Burimi i dritës" në "Komuniteti i Zhvilluesve të Fotosintezës", dhe më pas t'i vendosin dhe përdorin me shpejtësi këto modele bazuar në platformën DCU. Modelet DeepSeek V3 dhe R1 përdorin një sërë teknologjish inovative, të tilla si Vëmendja e fshehtë me shumë kokë (MLA), DeepSeekMoE, parashikimi me shumë shenja, trajnimi me saktësi të përzier FP8, etj., të cilat përmirësojnë ndjeshëm efikasitetin e trajnimit dhe performancën e përfundimit të modelit.