Haiguang Information Technology -tiimi suoritti onnistuneesti DeepSeek V3- ja R1-mallien mukautuksen Haiguang DCU:hun

185
Haiguang Information Technology Team sai äskettäin onnistuneesti päätökseen DeepSeek V3- ja R1-mallien mukauttamisen Haiguang DCU:hun (Depth Computing Unit) ja on virallisesti lanseerannut ne. Nyt käyttäjät voivat käyttää ja ladata asiaankuuluvia malleja "Photosynthesis Developer Community" -osiossa "Light Source" -osiossa ja ottaa sitten nopeasti käyttöön ja käyttää näitä DCU-alustaan perustuvia malleja. DeepSeek V3- ja R1-malleissa käytetään useita innovatiivisia teknologioita, kuten Multi-Head Latent Attention (MLA), DeepSeekMoE, multi-token-ennustus, FP8-sekoitettu tarkkuuskoulutus jne., jotka parantavat merkittävästi mallin harjoittelun tehokkuutta ja päättelykykyä.