SenseTime släpper den multimodala multi-task universella stora modellen "Scholar 2.5"

2024-12-20 10:35
 0
SenseTime släppte nyligen en multi-modal multi-task universell modell som heter "Scholar 2.5", med 3 miljarder parametrar. Det är den mest exakta och största ImageNet-modellen bland de globala modellerna med öppen källkod. Denna modell uppnådde en poäng på mer än 65,0 mAP i referensdatasetet COCO för objektdetektering, vilket ger effektiv och exakt uppfattnings- och förståelsestöd för allmänna scenuppgifter som autonom körning och robotar. För närvarande har "Scholar 2.5" släppts på OpenGVLab open source-plattformen.