Nhóm Công nghệ thông tin Haiguang đã hoàn thành thành công việc chuyển đổi các mô hình DeepSeek V3 và R1 sang Haiguang DCU

185
Nhóm công nghệ thông tin Haiguang gần đây đã hoàn thành thành công việc chuyển thể các mô hình DeepSeek V3 và R1 vào DCU (Đơn vị tính toán độ sâu) của Haiguang và đã chính thức ra mắt. Hiện nay, người dùng có thể truy cập và tải xuống các mô hình liên quan thông qua mục "Nguồn sáng" trong "Cộng đồng nhà phát triển quang hợp", sau đó nhanh chóng triển khai và sử dụng các mô hình này dựa trên nền tảng DCU. Các mô hình DeepSeek V3 và R1 sử dụng một số công nghệ tiên tiến, chẳng hạn như Multi-Head Latent Attention (MLA), DeepSeekMoE, dự đoán đa mã thông báo, đào tạo độ chính xác hỗn hợp FP8, v.v., giúp cải thiện đáng kể hiệu quả đào tạo và hiệu suất suy luận của mô hình.