SenseTime выпускает мультимодальную многозадачную универсальную большую модель «Ученый 2.5»

2024-12-20 10:35
 0
SenseTime недавно выпустила мультимодальную многозадачную универсальную большую модель под названием «Scholar 2.5» с 3 миллиардами параметров. Это самая точная и крупная модель ImageNet среди глобальных моделей с открытым исходным кодом. Эта модель получила оценку более 65,0 mAP в наборе тестовых данных по обнаружению объектов COCO, обеспечивая эффективное и точное восприятие и поддержку понимания общих сценариев, таких как автономное вождение и роботы. В настоящее время «Scholar 2.5» выпущен на платформе с открытым исходным кодом OpenGVLab.