Tim Teknologi Informasi Haiguang berhasil menyelesaikan adaptasi model DeepSeek V3 dan R1 ke Haiguang DCU

2025-02-06 16:00
 185
Tim Teknologi Informasi Haiguang baru-baru ini berhasil menyelesaikan adaptasi model DeepSeek V3 dan R1 ke DCU (Unit Komputasi Kedalaman) Haiguang, dan telah meluncurkannya secara resmi. Kini, pengguna dapat mengakses dan mengunduh model yang relevan melalui bagian "Sumber Cahaya" di "Komunitas Pengembang Fotosintesis", lalu dengan cepat menyebarkan dan menggunakan model ini berdasarkan platform DCU. Model DeepSeek V3 dan R1 menggunakan sejumlah teknologi inovatif, seperti Multi-Head Latent Attention (MLA), DeepSeekMoE, prediksi multi-token, pelatihan presisi campuran FP8, dll., yang secara signifikan meningkatkan efisiensi pelatihan dan kinerja inferensi model.