Команда Haiguang Information Technology успешно завершила адаптацию моделей DeepSeek V3 и R1 к Haiguang DCU

2025-02-06 16:00
 185
Недавно группа информационных технологий Haiguang успешно завершила адаптацию моделей DeepSeek V3 и R1 к Haiguang DCU (блоку глубинных вычислений) и официально запустила их. Теперь пользователи могут получить доступ к соответствующим моделям и загрузить их через раздел «Источник света» в «Сообществе разработчиков фотосинтеза», а затем быстро развернуть и использовать эти модели на базе платформы DCU. Модели DeepSeek V3 и R1 используют ряд инновационных технологий, таких как Multi-Head Latent Attention (MLA), DeepSeekMoE, многотокенное прогнозирование, смешанное обучение точности FP8 и т. д., которые значительно повышают эффективность обучения и производительность вывода модели.