Η ομάδα Πληροφορικής της Haiguang ολοκλήρωσε με επιτυχία την προσαρμογή των μοντέλων DeepSeek V3 και R1 στο Haiguang DCU

2025-02-06 16:00
 185
Η Ομάδα Πληροφορικής της Haiguang ολοκλήρωσε πρόσφατα με επιτυχία την προσαρμογή των μοντέλων DeepSeek V3 και R1 στο Haiguang DCU (Depth Computing Unit) και τα κυκλοφόρησε επίσημα. Τώρα, οι χρήστες μπορούν να έχουν πρόσβαση και να πραγματοποιούν λήψη σχετικών μοντέλων μέσω της ενότητας "Πηγή φωτός" στην "Κοινότητα προγραμματιστών Photosynthesis" και, στη συνέχεια, να αναπτύξουν και να χρησιμοποιήσουν γρήγορα αυτά τα μοντέλα με βάση την πλατφόρμα DCU. Τα μοντέλα DeepSeek V3 και R1 χρησιμοποιούν μια σειρά από καινοτόμες τεχνολογίες, όπως Multi-Head Latent Attention (MLA), DeepSeekMoE, multi-token prediction, FP8 μικτή εκπαίδευση ακριβείας κ.λπ., οι οποίες βελτιώνουν σημαντικά την απόδοση εκπαίδευσης και την απόδοση συμπερασμάτων του μοντέλου.