Haiguang axborot texnologiyalari jamoasi DeepSeek V3 va R1 modellarini Haiguang DCUga moslashtirishni muvaffaqiyatli yakunladi.

185
Xayguang axborot texnologiyalari jamoasi yaqinda DeepSeek V3 va R1 modellarini Haiguang DCU (chuqurlikdagi hisoblash birligi) ga moslashtirishni muvaffaqiyatli yakunladi va ularni rasman ishga tushirdi. Endi foydalanuvchilar “Fotosintez ishlab chiquvchilar hamjamiyati”dagi “Yorug‘lik manbai” bo‘limi orqali tegishli modellarga kirishlari va yuklab olishlari, so‘ngra DCU platformasi asosida ushbu modellarni tezda joylashtirishlari va ulardan foydalanishlari mumkin. DeepSeek V3 va R1 modellarida ko'p boshli yashirin diqqat (MLA), DeepSeekMoE, ko'p tokenli bashorat, FP8 aralash aniqlikdagi trening va boshqalar kabi qator innovatsion texnologiyalar qo'llaniladi, bu esa modelning o'qitish samaradorligi va xulosa chiqarish samaradorligini sezilarli darajada yaxshilaydi.