SenseTime frigiver den multimodale multi-task universelle store model "Scholar 2.5"

2024-12-20 10:35
 0
SenseTime udgav for nylig en multi-modal multi-task universel stor model kaldet "Scholar 2.5", med 3 milliarder parametre. Det er den mest nøjagtige og største ImageNet-model blandt de globale open source-modeller. Denne model opnåede en score på mere end 65,0 mAP i objektdetektions benchmarkdatasættet COCO, hvilket giver effektiv og præcis opfattelse og forståelsesstøtte til generelle scenarieopgaver såsom autonom kørsel og robotter. I øjeblikket er "Scholar 2.5" blevet udgivet på OpenGVLab open source-platformen.