SenseTime veröffentlicht das multimodale, universelle Multitasking-Großmodell „Scholar 2.5“-Redplanx

SenseTime hat kürzlich ein multimodales, universelles Multitasking-Großmodell namens „Scholar 2.5“ mit 3 Milliarden Parametern veröffentlicht. Es ist das genaueste und größte ImageNet-Modell unter den globalen Open-Source-Modellen. Dieses Modell erreichte im Objekterkennungs-Benchmark-Datensatz COCO eine Punktzahl von mehr als 65,0 mAP und bietet effiziente und genaue Wahrnehmungs- und Verständnisunterstützung für allgemeine Szenarioaufgaben wie autonomes Fahren und Roboter. Derzeit ist „Scholar 2.5“ auf der Open-Source-Plattform OpenGVLab veröffentlicht.