Matagumpay na nakumpleto ng Haiguang Information Technology team ang adaptasyon ng DeepSeek V3 at R1 na mga modelo sa Haiguang DCU

185
Matagumpay na nakumpleto kamakailan ng Haiguang Information Technology Team ang adaptasyon ng DeepSeek V3 at R1 na modelo sa Haiguang DCU (Depth Computing Unit), at opisyal na itong inilunsad. Ngayon, ang mga user ay maaaring mag-access at mag-download ng mga nauugnay na modelo sa pamamagitan ng seksyong "Light Source" sa "Photosynthesis Developer Community", at pagkatapos ay mabilis na i-deploy at gamitin ang mga modelong ito batay sa DCU platform. Gumagamit ang DeepSeek V3 at R1 na mga modelo ng ilang makabagong teknolohiya, tulad ng Multi-Head Latent Attention (MLA), DeepSeekMoE, multi-token prediction, FP8 mixed precision training, atbp., na makabuluhang nagpapabuti sa kahusayan sa pagsasanay at inference na pagganap ng modelo.