ทีมงาน Haiguang Information Technology ประสบความสำเร็จในการปรับโมเดล DeepSeek V3 และ R1 ให้เป็น Haiguang DCU

185
ล่าสุด ทีมเทคโนโลยีสารสนเทศ Haiguang ประสบความสำเร็จในการปรับโมเดล DeepSeek V3 และ R1 ให้กับ Haiguang DCU (Depth Computing Unit) ได้สำเร็จ และได้เปิดตัวอย่างเป็นทางการแล้ว ขณะนี้ ผู้ใช้สามารถเข้าถึงและดาวน์โหลดโมเดลที่เกี่ยวข้องผ่านทางส่วน "แหล่งกำเนิดแสง" ใน "ชุมชนนักพัฒนาการสังเคราะห์แสง" จากนั้นปรับใช้และใช้งานโมเดลเหล่านี้ได้อย่างรวดเร็วโดยอิงบนแพลตฟอร์ม DCU โมเดล DeepSeek V3 และ R1 ใช้เทคโนโลยีเชิงนวัตกรรมมากมาย เช่น Multi-Head Latent Attention (MLA), DeepSeekMoE, การทำนายโทเค็นหลายตัว, การฝึกความแม่นยำแบบผสม FP8 ฯลฯ ซึ่งช่วยปรับปรุงประสิทธิภาพการฝึกและประสิทธิภาพการอนุมานของโมเดลได้อย่างมีนัยสำคัญ