SenseTime lança o modelo grande universal multimodal multitarefa "Scholar 2.5"

2024-12-20 10:35
 0
SenseTime lançou recentemente um grande modelo universal multimodal multitarefa chamado "Scholar 2.5", com 3 bilhões de parâmetros. É o maior e mais preciso modelo ImageNet entre os modelos globais de código aberto. Este modelo alcançou uma pontuação de mais de 65,0 mAP no conjunto de dados de benchmark de detecção de objetos COCO, fornecendo percepção eficiente e precisa e suporte de compreensão para tarefas de cenário geral, como direção autônoma e robôs. Atualmente, o "Scholar 2.5" foi lançado na plataforma de código aberto OpenGVLab.