Pasukan Teknologi Maklumat Haiguang berjaya menyelesaikan penyesuaian model DeepSeek V3 dan R1 kepada Haiguang DCU

2025-02-06 16:00
 185
Pasukan Teknologi Maklumat Haiguang baru-baru ini berjaya menyempurnakan penyesuaian model DeepSeek V3 dan R1 kepada Haiguang DCU (Unit Pengkomputeran Kedalaman), dan telah melancarkannya secara rasmi. Kini, pengguna boleh mengakses dan memuat turun model yang berkaitan melalui bahagian "Sumber Cahaya" dalam "Komuniti Pembangun Fotosintesis", dan kemudian menggunakan dan menggunakan model ini dengan pantas berdasarkan platform DCU. Model DeepSeek V3 dan R1 menggunakan beberapa teknologi inovatif, seperti Multi-Head Latent Attention (MLA), DeepSeekMoE, ramalan berbilang token, latihan ketepatan campuran FP8, dsb., yang meningkatkan kecekapan latihan dan prestasi inferens model dengan ketara.