Каманда Haiguang Information Technology паспяхова завяршыла адаптацыю мадэляў DeepSeek V3 і R1 да Haiguang DCU

185
Каманда Haiguang Information Technology нядаўна паспяхова завяршыла адаптацыю мадэляў DeepSeek V3 і R1 да Haiguang DCU (Depth Computing Unit) і афіцыйна запусціла іх. Цяпер карыстальнікі могуць атрымліваць доступ і спампоўваць адпаведныя мадэлі праз раздзел «Крыніца святла» ў «Супольнасці распрацоўшчыкаў Photosynthesis», а затым хутка разгортваць і выкарыстоўваць гэтыя мадэлі на аснове платформы DCU. У мадэлях DeepSeek V3 і R1 выкарыстоўваецца шэраг інавацыйных тэхналогій, такіх як Multi-Head Latent Attention (MLA), DeepSeekMoE, multi-token prediction, FP8 mixed precision training і інш., якія значна павышаюць эфектыўнасць навучання і прадукцыйнасць вываду мадэлі.