Il team di Haiguang Information Technology ha completato con successo l'adattamento dei modelli DeepSeek V3 e R1 a Haiguang DCU

185
Il team di tecnologia informatica di Haiguang ha recentemente completato con successo l'adattamento dei modelli DeepSeek V3 e R1 alla DCU (Depth Computing Unit) di Haiguang e li ha lanciati ufficialmente. Ora gli utenti possono accedere e scaricare i modelli pertinenti tramite la sezione "Sorgente luminosa" nella "Photosynthesis Developer Community", per poi distribuire e utilizzare rapidamente questi modelli basati sulla piattaforma DCU. I modelli DeepSeek V3 e R1 utilizzano una serie di tecnologie innovative, come Multi-Head Latent Attention (MLA), DeepSeekMoE, previsione multi-token, addestramento a precisione mista FP8, ecc., che migliorano significativamente l'efficienza dell'addestramento e le prestazioni di inferenza del modello.