SenseTime пуска мултимодалния многозадачен универсален голям модел "Scholar 2.5"

0
SenseTime наскоро пусна мултимодален многозадачен универсален голям модел, наречен "Scholar 2.5", с 3 милиарда параметри. Това е най-точният и най-голям модел на ImageNet сред глобалните модели с отворен код. Този модел постигна резултат от повече от 65,0 mAP в набора от сравнителни данни за откриване на обекти COCO, осигурявайки ефективна и точна подкрепа за възприятие и разбиране за общи сценични задачи като автономно шофиране и роботи. В момента "Scholar 2.5" е пуснат на платформата с отворен код OpenGVLab.