Das Haiguang Information Technology-Team hat die Anpassung der DeepSeek V3- und R1-Modelle an Haiguang DCU erfolgreich abgeschlossen

185
Das Haiguang Information Technology Team hat vor Kurzem die Anpassung der Modelle DeepSeek V3 und R1 an die Haiguang DCU (Depth Computing Unit) erfolgreich abgeschlossen und sie offiziell eingeführt. Jetzt können Benutzer über den Abschnitt „Lichtquelle“ in der „Photosynthesis Developer Community“ auf relevante Modelle zugreifen und diese Modelle dann basierend auf der DCU-Plattform schnell bereitstellen und verwenden. Die Modelle DeepSeek V3 und R1 verwenden eine Reihe innovativer Technologien wie Multi-Head Latent Attention (MLA), DeepSeekMoE, Multi-Token-Vorhersage, FP8-Mixed-Precision-Training usw., die die Trainingseffizienz und Inferenzleistung des Modells deutlich verbessern.