Екипът на Haiguang Information Technology успешно завърши адаптирането на моделите DeepSeek V3 и R1 към Haiguang DCU

185
Екипът за информационни технологии на Haiguang наскоро завърши успешно адаптирането на моделите DeepSeek V3 и R1 към Haiguang DCU (Depth Computing Unit) и ги пусна официално. Сега потребителите могат да имат достъп и да изтеглят съответните модели чрез секцията „Източник на светлина“ в „Общността на разработчиците на Photosynthesis“ и след това бързо да внедряват и използват тези модели въз основа на платформата DCU. Моделите DeepSeek V3 и R1 използват редица иновативни технологии, като Multi-Head Latent Attention (MLA), DeepSeekMoE, multi-token prediction, FP8 mixed precision training и т.н., които значително подобряват ефективността на обучението и производителността на изводите на модела.