SenseTime випускає мультимодальну багатозадачну універсальну велику модель «Scholar 2.5»

2024-12-20 10:35
 0
SenseTime нещодавно випустив мультимодальну багатозадачну універсальну велику модель під назвою "Scholar 2.5" із 3 мільярдами параметрів. Це найточніша та найбільша модель ImageNet серед глобальних моделей із відкритим кодом. Ця модель досягла показника понад 65,0 mAP у тестовому наборі даних виявлення об’єктів COCO, забезпечуючи ефективне й точне сприйняття та підтримку розуміння для завдань загального сценарію, таких як автономне водіння та роботи. Наразі «Scholar 2.5» випущено на платформі з відкритим кодом OpenGVLab.