SenseTime lanserer den multi-modale multi-task universelle store modellen "Scholar 2.5"

2024-12-20 10:35
 0
SenseTime lanserte nylig en multi-modal multi-task universell stor modell kalt "Scholar 2.5", med 3 milliarder parametere. Det er den mest nøyaktige og største ImageNet-modellen blant de globale open source-modellene. Denne modellen oppnådde en score på mer enn 65,0 mAP i referansedatasettet for gjenkjenning av objekter COCO, og ga effektiv og nøyaktig persepsjon og forståelsesstøtte for generelle scenariooppgaver som autonom kjøring og roboter. For øyeblikket har "Scholar 2.5" blitt utgitt på OpenGVLab åpen kildekode-plattform.