Haiguangi infotehnoloogia meeskond viis edukalt lõpule DeepSeek V3 ja R1 mudelite kohandamise Haiguangi DCU-ga

2025-02-06 16:00
 185
Haiguangi infotehnoloogiameeskond lõpetas hiljuti edukalt DeepSeek V3 ja R1 mudelite kohandamise Haiguangi DCU-ga (sügavarvutusüksus) ning on need ametlikult turule toonud. Nüüd saavad kasutajad asjakohastele mudelitele juurde pääseda ja alla laadida jaotise "Valgusallikas" kaudu "Photosynthesis Developer Community" ning seejärel kiiresti juurutada ja kasutada neid DCU platvormil põhinevaid mudeleid. DeepSeek V3 ja R1 mudelid kasutavad mitmeid uuenduslikke tehnoloogiaid, nagu Multi-Head Latent Attention (MLA), DeepSeekMoE, mitme märgi ennustus, FP8 segatud täpsustreening jne, mis parandavad oluliselt mudeli koolituse efektiivsust ja järelduste jõudlust.