ทีมงาน Haiguang Information Technology ประสบความสำเร็จในการปรับโมเดล DeepSeek V3 และ R1 ให้เป็น Haiguang DCU

2025-02-06 16:00
 185
ล่าสุด ทีมเทคโนโลยีสารสนเทศ Haiguang ประสบความสำเร็จในการปรับโมเดล DeepSeek V3 และ R1 ให้กับ Haiguang DCU (Depth Computing Unit) ได้สำเร็จ และได้เปิดตัวอย่างเป็นทางการแล้ว ขณะนี้ ผู้ใช้สามารถเข้าถึงและดาวน์โหลดโมเดลที่เกี่ยวข้องผ่านทางส่วน "แหล่งกำเนิดแสง" ใน "ชุมชนนักพัฒนาการสังเคราะห์แสง" จากนั้นปรับใช้และใช้งานโมเดลเหล่านี้ได้อย่างรวดเร็วโดยอิงบนแพลตฟอร์ม DCU โมเดล DeepSeek V3 และ R1 ใช้เทคโนโลยีเชิงนวัตกรรมมากมาย เช่น Multi-Head Latent Attention (MLA), DeepSeekMoE, การทำนายโทเค็นหลายตัว, การฝึกความแม่นยำแบบผสม FP8 ฯลฯ ซึ่งช่วยปรับปรุงประสิทธิภาพการฝึกและประสิทธิภาพการอนุมานของโมเดลได้อย่างมีนัยสำคัญ