A Haiguang Information Technology csapata sikeresen befejezte a DeepSeek V3 és R1 modellek adaptálását a Haiguang DCU-hoz

2025-02-06 16:00
 185
A Haiguang Information Technology Team a közelmúltban sikeresen befejezte a DeepSeek V3 és R1 modellek adaptálását a Haiguang DCU-hoz (Depth Computing Unit), és hivatalosan is elindította azokat. Mostantól a felhasználók hozzáférhetnek és letölthetik a releváns modelleket a "Photosynthesis Developer Community" "Fényforrás" szakaszán keresztül, majd gyorsan telepíthetik és használhatják ezeket a modelleket a DCU platformon. A DeepSeek V3 és R1 modellek számos innovatív technológiát alkalmaznak, mint például a Multi-Head Latent Attention (MLA), a DeepSeekMoE, a több token előrejelzés, az FP8 vegyes precíziós képzés stb., amelyek jelentősen javítják a modell képzési hatékonyságát és következtetési teljesítményét.