Команда Haiguang Information Technology успішно завершила адаптацію моделей DeepSeek V3 і R1 до Haiguang DCU

185
Команда інформаційних технологій Haiguang нещодавно успішно завершила адаптацію моделей DeepSeek V3 і R1 до Haiguang DCU (Depth Computing Unit) і офіційно запустила їх. Тепер користувачі можуть отримати доступ і завантажити відповідні моделі через розділ «Джерело світла» в «Спільноті розробників Photosynthesis», а потім швидко розгорнути та використовувати ці моделі на основі платформи DCU. Моделі DeepSeek V3 і R1 використовують низку інноваційних технологій, таких як Multi-Head Latent Attention (MLA), DeepSeekMoE, multi-token prediction, FP8 mixed precision training тощо, які значно підвищують ефективність навчання та ефективність висновків моделі.