SenseTime rilascia il modello universale multimodale multitask di grandi dimensioni "Scholar 2.5"

2024-12-20 10:35
 0
SenseTime ha recentemente rilasciato un modello universale multimodale multitasking chiamato "Scholar 2.5", con 3 miliardi di parametri. È il modello ImageNet più accurato e più grande tra i modelli open source globali. Questo modello ha ottenuto un punteggio di oltre 65,0 mAP nel set di dati di benchmark del rilevamento di oggetti COCO, fornendo una percezione efficiente e accurata e un supporto alla comprensione per attività di scenari generali come la guida autonoma e i robot. Attualmente, "Scholar 2.5" è stato rilasciato sulla piattaforma open source OpenGVLab.