Haiguang 정보기술팀은 DeepSeek V3 및 R1 모델을 Haiguang DCU에 적용하는 작업을 성공적으로 완료했습니다.

185
하이광 정보기술팀은 최근 DeepSeek V3와 R1 모델을 하이광 DCU(심도 컴퓨팅 유닛)에 성공적으로 적용하고 공식 출시했습니다. 이제 사용자는 "광합성 개발자 커뮤니티"의 "광원" 섹션을 통해 관련 모델에 액세스하여 다운로드한 다음 DCU 플랫폼 기반으로 이러한 모델을 신속하게 배포하여 사용할 수 있습니다. DeepSeek V3 및 R1 모델은 Multi-Head Latent Attention(MLA), DeepSeekMoE, 다중 토큰 예측, FP8 혼합 정밀도 학습 등의 여러 가지 혁신적인 기술을 사용하여 모델의 학습 효율성과 추론 성능을 크게 향상시킵니다.