SenseTime lansează modelul mare universal multimodal multi-task „Scholar 2.5”

0
SenseTime a lansat recent un model mare universal multimodal multi-task numit „Scholar 2.5”, cu 3 miliarde de parametri. Este cel mai precis și mai mare model ImageNet dintre modelele open source la nivel mondial. Acest model a obținut un scor de peste 65,0 mAP în setul de date de referință de detectare a obiectelor COCO, oferind suport de percepție și înțelegere eficientă și precisă pentru sarcinile de scenariu general, cum ar fi conducerea autonomă și roboții. În prezent, „Scholar 2.5” a fost lansat pe platforma open source OpenGVLab.