SenseTime julkaisee multimodaalisen moniajo-universaalin suuren mallin "Scholar 2.5"

2024-12-20 10:35
 0
SenseTime julkaisi äskettäin multimodaalisen monitoimimallin nimeltä "Scholar 2.5", jolla on 3 miljardia parametria. Se on tarkin ja suurin ImageNet-malli maailmanlaajuisista avoimen lähdekoodin malleista. Tämä malli saavutti yli 65,0 mAP:n kohteen havaitsemisen vertailutietojoukossa COCO, mikä tarjoaa tehokkaan ja tarkan havainnon ja ymmärtämisen tuen yleisissä skenaariotehtävissä, kuten autonomisessa ajamisessa ja roboteissa. Tällä hetkellä "Scholar 2.5" on julkaistu OpenGVLab avoimen lähdekoodin alustalle.