Haiguang informacinių technologijų komanda sėkmingai užbaigė DeepSeek V3 ir R1 modelių pritaikymą Haiguang DCU

2025-02-06 16:00
 185
Haiguang informacinių technologijų komanda neseniai sėkmingai užbaigė DeepSeek V3 ir R1 modelių pritaikymą Haiguang DCU (gilio skaičiavimo vienetui) ir oficialiai juos pristatė. Dabar vartotojai gali pasiekti ir atsisiųsti atitinkamus modelius per „Photosynthesis Developer Community“ skyrių „Šviesos šaltinis“, o tada greitai įdiegti ir naudoti šiuos modelius, pagrįstus DCU platforma. DeepSeek V3 ir R1 modeliuose naudojama daugybė novatoriškų technologijų, tokių kaip Multi-Head Latent Attention (MLA), DeepSeekMoE, kelių žetonų numatymas, FP8 mišrus tikslumo mokymas ir kt., kurios žymiai pagerina mokymo efektyvumą ir modelio išvadų našumą.