Хайгуаны мэдээллийн технологийн баг DeepSeek V3 болон R1 загваруудыг Хайгуан DCU-д тохируулан амжилттай хийж дуусгалаа.

2025-02-06 16:00
 185
Хайгуаны мэдээллийн технологийн баг саяхан DeepSeek V3 болон R1 загваруудыг Хайгуан DCU (Гүн тооцооллын нэгж)-д тохируулан амжилттай хийж, албан ёсоор ашиглалтад орууллаа. Одоо хэрэглэгчид "Фотосинтез хөгжүүлэгчдийн нийгэмлэг" дэх "Гэрлийн эх үүсвэр" хэсгээс холбогдох загварт хандаж, татаж аваад DCU платформ дээр тулгуурлан эдгээр загваруудыг хурдан байрлуулж, ашиглах боломжтой боллоо. DeepSeek V3 болон R1 загварууд нь олон толгойн далд анхаарал (MLA), DeepSeekMoE, олон токен таамаглал, FP8 холимог нарийвчлалын сургалт гэх мэт олон шинэлэг технологийг ашигладаг бөгөөд энэ нь сургалтын үр ашиг, загварын дүгнэлтийн гүйцэтгэлийг ихээхэн сайжруулдаг.