海光資訊科技團隊成功完成DeepSeek V3與R1模型與海光DCU的適配

185
海光信息技术团队最近成功完成了DeepSeek V3和R1模型与海光DCU(深度计算单元)的适配,并已正式上线。现在,用户可以通过“光合开发者社区”中的“光源”板块访问并下载相关模型,然后基于DCU平台快速部署和使用这些模型。DeepSeek V3和R1模型采用了多项创新技术,如Multi-Head Latent Attention(MLA)、DeepSeekMoE、多令牌预测、FP8混合精度训练等,显著提高了模型的训练效率和推理性能。