ທີມງານເຕັກໂນໂລຊີຂໍ້ມູນຂ່າວສານແຂວງໄຫກວາງໄດ້ສໍາເລັດການປັບຕົວແບບ DeepSeek V3 ແລະ R1 ກັບ Haiguang DCU

185
ບໍ່ດົນມານີ້, ທີມງານເຕັກໂນໂລຊີຂໍ້ມູນຂ່າວສານແຂວງໄຫກວາງໄດ້ສໍາເລັດສົບຜົນສໍາເລັດການປັບຕົວແບບ DeepSeek V3 ແລະ R1 ກັບ Haiguang DCU (Depth Computing Unit), ແລະໄດ້ເປີດຕົວຢ່າງເປັນທາງການ. ໃນປັດຈຸບັນ, ຜູ້ໃຊ້ສາມາດເຂົ້າເຖິງແລະດາວໂຫລດຕົວແບບທີ່ກ່ຽວຂ້ອງໂດຍຜ່ານ "ແຫຼ່ງແສງສະຫວ່າງ" ໃນ "ຊຸມຊົນນັກພັດທະນາ Photosynthesis", ແລະຫຼັງຈາກນັ້ນນໍາໃຊ້ແລະນໍາໃຊ້ຕົວແບບເຫຼົ່ານີ້ຢ່າງໄວວາໂດຍອີງໃສ່ແພລະຕະຟອມ DCU. ຮູບແບບ DeepSeek V3 ແລະ R1 ໃຊ້ເຕັກໂນໂລຢີນະວັດຕະກໍາຈໍານວນຫນຶ່ງ, ເຊັ່ນ Multi-Head Latent Attention (MLA), DeepSeekMoE, multi-token ການຄາດຄະເນ, ການຝຶກອົບຮົມຄວາມແມ່ນຍໍາປະສົມ FP8, ແລະອື່ນໆ, ເຊິ່ງປັບປຸງປະສິດທິພາບການຝຶກອົບຮົມແລະການປະຕິບັດ inference ຂອງຕົວແບບຢ່າງຫຼວງຫຼາຍ.