海光信息技术团队成功完成DeepSeek V3和R1模型与海光DCU的适配

2025-02-06 16:00
 185

海光信息技术团队最近成功完成了DeepSeek V3和R1模型与海光DCU(深度计算单元)的适配,并已正式上线。现在,用户可以通过“光合开发者社区”中的“光源”板块访问并下载相关模型,然后基于DCU平台快速部署和使用这些模型。DeepSeek V3和R1模型采用了多项创新技术,如Multi-Head Latent Attention(MLA)、DeepSeekMoE、多令牌预测、FP8混合精度训练等,显著提高了模型的训练效率和推理性能。