نجح فريق تكنولوجيا المعلومات في Haiguang في إتمام تكييف طرازي DeepSeek V3 وR1 مع وحدة تحكم DCU في Haiguang

185
نجح فريق تكنولوجيا المعلومات في شركة Haiguang مؤخرًا في إكمال تكييف طرازي DeepSeek V3 وR1 مع وحدة Haiguang DCU (وحدة الحوسبة العميقة)، وأطلقهما رسميًا. الآن، أصبح بإمكان المستخدمين الوصول إلى النماذج ذات الصلة وتنزيلها من خلال قسم "مصدر الضوء" في "مجتمع مطوري التمثيل الضوئي"، ثم نشر هذه النماذج واستخدامها بسرعة استنادًا إلى منصة DCU. تستخدم نماذج DeepSeek V3 وR1 عددًا من التقنيات المبتكرة، مثل Multi-Head Latent Attention (MLA)، وDeepSeekMoE، والتنبؤ متعدد الرموز، والتدريب الدقيق المختلط FP8، وما إلى ذلك، مما يحسن بشكل كبير من كفاءة التدريب وأداء الاستدلال للنموذج.